Bit depth

Hier wil ik het hebben over bit depth of bitdiepte. Het verschil in resolutie op een foto van een lage bit depth en een van een hogere bit depth is gemakkelijk te zien, dus is het ook logisch om te veronderstellen dat een hogere bit depth in audio ook een betere kwaliteit betekent. Deze veronderstelling wordt nog verder versterkt door het feit dat de term ‘resolutie’ vaak wordt toegepast op bitdepth en uiteraard betekent hogere resolutie een hogere kwaliteit. Dus 24bit is hoog resolutie audio en omdat 24bit meer gegevens bevat, en dus een hogere resolutie is, ook een betere kwaliteit. Allemaal volledig logische veronderstelling, maar ik ben bang dat deze veronderstellingen niet in lijn zijn met de werkelijke feiten over hoe digitale audio werkt. Ik zal het proberen uit te leggen:

Bij het opnemen zal een analoog naar digitaal converter (ADC) de inkomende analoge golfvorm lezen en meet het deze vele malen per seconde *1. Bij een CD is dit 44.100 metingen per seconde (de bemonsteringsfrequentie). Deze metingen worden opgeslagen in het digitale domein in de vorm van computer bits. Hoe meer bits we gebruiken, hoe nauwkeuriger we de analoge golfvorm kunnen meten. Dit komt omdat elke bit maar twee waarden (0 of 1) kan hebben, om meer waarden met bits te krijgen doen we het zelfde als met een normale telling. Voorbeeld: Zodra we bij 9 zijn aangeland moeten we een nieuw kolom (de kolom tientallen) toe voegen en we kunnen kolommen blijven toevoegen voor de 100, 1000, 10000, enz. Exact hetzelfde geldt voor bits, maar omdat we maar twee waarden (in plaats van 10) per bit hebben, hebben wij ook meer kolommen nodig, elke kolom (of extra bit) verdubbelt het aantal waarden welke we beschikbaar krijgen. Bijvoorbeeld: 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024 …. Bekende getallen welke overal op duiken waar gebruik wordt gemaakt van computertechnologie. Bij 16bit hebben we ongeveer 65.000 verschillende waarden beschikbaar. Het probleem is echter dat een analoge golfvorm voortdurend wisselend. Ongeacht hoeveel keer per seconde dat we de golfvorm meten of hoeveel bits we gebruiken om de meting op te slaan, er zullen altijd fouten zijn. Deze fouten in het kwantificeren van de waarde van een voortdurend veranderende golfvorm worden kwantificatie fouten genoemd. Kwantificatie fouten zijn slecht, ze veroorzaken vervorming in de golfvorm op het moment dat we deze terug converteren naar analoog en dit beluisteren.

Wat ik tot nu toe heb gezegd ondersteund de veronderstelling van hoe digitale audio werkt nog steeds. Ik lijk de veronderstelling dat, meer bits is een hogere resolutie, te bevestigen. Dat is waar, echter waar de feiten gaan afwijken van de veronderstelling is in het begrijpen van de resultaten van deze hogere resolutie. Even weer terug naar wat ik hierboven zei, elke keer als we de bit depth uitbreiden met een bit, verdubbelen we het aantal waarden welke we beschikbaar hebben (vb. 4bit = 16 waarden, 5bit = 32 waarden). Als we het aantal waarden verdubbelen halveren we de hoeveelheid kwantificatie fouten. Volgt u mij nog? Want nu komen we tot de kern van de zaak. Er is in feite een perfecte oplossing om kwantificatie fouten volledig (100%) te elimineren, dit proces heet “ditheren” en is ingebouwd in elke ADC welke op de markt te krijgen is

Wat is Dither? In wezen wordt tijdens het conversieproces een zeer kleine hoeveelheid witte ruis aan het signaal toegevoegd hierdoor worden de kwantificatie fouten volledig gerandomiseerd. Gerandomiseerd digitale audio, eenmaal weer omgezet naar analoog wordt gehoord als zuiver wit (niet gecorreleerde) ruis. Het resultaat is dat we een perfect meting van de golfvorm hebben plus wat lawaai. Zowel bij 24, 16, 8, 4, 2 en ja zelfs 1 bit (DSD). Hoeveel lawaai (hoe luid dit is) wordt door de bitdepth bepaald. Maar de golfvorm is perfect!

Het concept van de perfecte meting en het opnieuw creëren van een perfect golfvorm lijkt misschien marketing hype maar is het in dit geval niet. Het is in feite het fundamentele principe van de Nyquist-Shannon bemonsteringstheorie waarop het bestaan en de uitvinding van digitale audio is gebaseerd. Ik weet dat er mensen zijn welke het niet eens zullen zijn met dit idee, helaas, een meningsverschil hierin is geen optie. Deze stelling is niet uitgevonden om uit te leggen hoe de digitale audio werkt, het is andersom. Digitale audio is uitgevonden uit de stelling, als je de stelling niet gelooft dan geloof je niet in digitale audio!

Met andere woorden, door ditheren worden alle meetfouten omgezet naar ruis.

Hopelijk volgt u mij nog, want nu gaan we precies kijken wat er gebeurt met de bitdepth. Teruggaan naar het bovenstaande, als we een bit toevoegen verdubbelen we het aantal beschikbare waarden en dus halveren van het aantal kwantificatie fouten. Als we het aantal kwantificatie fouten halveren, zal het resultaat (na dithering) een perfect golfvorm zijn met de halve hoeveelheid ruis. Om dit met behulp van audio terminologie uit te drukken, elk bit extra data verplaatst de geluidsvloer (lawaai) naar beneden met 6dB (de helft). We kunnen dit ook omdraaien en zeggen dat elke bit aan data geeft 6dB aan dynamisch bereik. Dynamisch bereik, is het volumebereik tussen minimum en het maximum volume. Dus 16bit x 6dB = 96dB. Dit 96dB cijfer bepaalt het dynamisch bereik van de cd. (24bit x 6 dB = 144dB).

Dus, 24bit voegt meer ‘resolutie’ in vergelijking met 16bit toe, maar deze extra resolutie betekent niet een hogere kwaliteit, het betekent gewoon dat we een groter dynamisch bereik coderen. Dit is een misverstand gemaakt door velen. Er zijn geen extra magische eigenschappen, niets dat de wetenschap niet begrijpt of niet kan meten. Het enige verschil tussen 16bit en 24bit is 48 dB dynamisch bereik (8bits x 6 dB = 48 dB) en niks anders. Dit is niet een vraag over interpretatie of mening, het is het bewijsbaar, onbetwiste logische wiskunde die ten grondslag ligt aan het bestaan van digitale audio.

Dus, kun je alle voordelen van de grotere (48dB meer) dynamisch bereik beschikbaar door 24bit eigenlijk wel horen? Helaas, nee dat kan niet. Het volledige dynamische bereik van sommige soorten van muziek is soms minder dan 12dB. Opnames met het grootste dynamische bereik zijn vaak symfonieorkest opnames maar ook deze zullen vrijwel nooit een dynamisch bereik van meer dan ongeveer 60dB hebben. Deze zijn allemaal ruim binnen de 96 dB bereik welke de nederige CD kan bieden. Sterker nog, moderne dithering technieken, zorgen er voor dat het dynamische bereik van de CD door de quantisatie ruis te verhuizen buiten een frequentieband waar ons gehoor het meest gevoelig is groter wordt. Dit geeft een bruikbaar dynamisch bereik aan een CD van maximaal 120dB (150dB op bepaalde frequentiebanden).

Stel je eens voor dat we bij het afspelen van een CD, de versterker zo hebben ingesteld dat de stilste geluiden op de CD net boven het geluidsniveau van de luisteromgeving (zitkamer of hoofdtelefoon) kunnen worden gehoord. Dus als het gemiddelde geluidsniveau in een zitkamer laten we zeggen 50 dB is (of 30 dB voor hoofdtelefoon) dan zal het dynamische bereik van de CD beginnen op dit punt en kan het 96 dB (tenminste) boven deze geluidsvloer uitkomen. Als het volledige dynamische bereik van een CD daadwerkelijk werd toegepast (bovenop het geluidsvloer), zou dit voor de thuis luisteraar (als deze over geschikt apparatuur zou beschikken) vrijwel zeker leiden tot ernstige pijn en blijvende gehoorschade. Als dit het geval is met CD, hoe zit het dan met 24bit? Als we het volledige dynamische bereik van 24-bits gebruiken en een luisteraar had de apparatuur om het allemaal te reproduceren, is er een redelijke kans, afhankelijk van leeftijd en algemene gezondheid, dat die luisteraar direct zou sterven. De meest fitte luisteraar zou waarschijnlijk voor een paar weken in een coma raken om daarna volledig doof hieruit te ontwaken. Ik maak geen grapjes en overdrijf ook niet denk er maar eens over na, 144dB + laten we zeggen 50 dB voor luisteromgevingslawaai van de kamer. 180dB is het vaak geciteerde cijfer voor geluidsdruk krachtig genoeg om te doden en sommige mensen zijn gedood door 160dB. Het is echter onwaarschijnlijk dat dit gebeurt omdat er geen DAC’s zijn welke de 144dB dynamisch bereik van 24-bits (dus er zijn geen echt 24bit converters *2) uit te sturen, bijna niemand heeft een luidsprekersysteem welke in staat is om 144dB dynamisch bereik weer te geven en zoals eerder gezegd, rond 60dB is het grootste dynamisch bereik welke u kunt vinden op een commerciële opname.

Dus, als je de feiten accepteert, waarom bestaat 24bit audio, wat is het nut hiervan? Er zijn een aantal nuttige toepassing voor 24bit bij het opnemen en mixen van muziek. In feite, tijdens het mixen is 32-bits resolutie tegenwoordig de norm om te gebruiken. De reden hiervoor is dat het nuttig is bij het optellen van meerdere sporen, meerdere, in serie, verwerking van opdrachten en vooral ruimte voor fouten (te hard optellen van multitracks). Met andere woorden, 24bit is erg handig bij het opnemen en mixen maar zinloos voor het afspelen. Vergeet niet, zelfs bij een opname met 60 dB dynamisch bereik wordt alleen 10bits van de gegevens gebruikt, de andere 6bits op een CD zijn slechts extra ruimte om de ruis te plaatsen. Dus, het verschil tussen 16bit en 24bit is een extra 8bits aan ruimte.

16Bit24

Ik weet dat sommige mensen nu gaan zeggen dat dit allemaal onzin is, en dat zij “gemakkelijk het verschil tussen een 16bit commerciële opname en een 24bit hoog resolutie versie kunnen horen”. Helaas, dat kunt je niet, het is niet dat je niet de apparatuur of de oren er voor hebt, het is domweg voor een mens onmogelijk om, zowel in theorie als in de praktijk onder welke omstandigheden dan ook, dit waar te nemen!! Als je een 24bit opname afspeelt en vervolgens dezelfde opname in 16bit en je merkt een verschil, dan komt dit omdat er iets is ‘gedaan’ met de opname, een ongepast verwerking hierop is gebruikt of je hoort een verschil omdat je dit verschil verwacht.

Zolang muziek slecht wordt gemixd en of gemasterd hebben we zelfs helemaal geen 16 bit nodig. Als de DR (Dynamiek, zie masteren) 5 of minder is zou je met 8 bit genoeg hebben. Behalve dat we in stiltes de ruisvloer dan zouden kunnen horen.

*1 Eigenlijk is het proces van AD conversie een beetje ingewikkelder namelijk met behulp van oversampling (zeer hoge sampling frequentie) en slechts een handvol aan bits. Later in het conversieproces wordt deze eerste bemonstering weer terug ‘gedecimeerd’ naar de gewenste bitdepth en sample rate.

*2 Bij het verschil van 16 naar 24 bit komen we in theorie onder het lawaai welke de weerstanden in onze apparatuur (ook als ze uit staan) bij kamertemperatuur maken.. Thermische ruis.
Het dynamisch bereik van 24 bit kan dus domweg niet weergegeven worden.

2 gedachten over “Bit depth”

  1. Betreft “Dus als het gemiddelde geluidsniveau in een zitkamer laten we zeggen 50 dB is . . . (50 dB + 96 dB = 146 dB)”
    Je gaat een cd toch niet zo hard zetten dat de laatste bit een blokgolf van 56 dB veroorzaakt. Neen, hij mag zo hard staan dat de dither net niet meer te horen. Laten we zeggen 15 dB in een rustige kamer waar de stilste momenten 35 dB opleveren. Tel daarbij 90 dB op, of minder als de dither meer dan 1 bit gebruikt, dan is de maximale geluidspiek 105 dB. In de praktijk komt dat overeen met een geluidsniveau van rond 95 dB.
    Dat is overigens ruim voldoende voor een orkestwerk.
    Met normale luidsprekers in een normale huiskamer is hiervoor een kwaliteitsverstekers van 2×40 W ruim voldoende. Immers, kwalliteit wil zeggen dat hij een piek van 200 W aan kan zonder in de problemen te komen.

    Een goede studiomicrofoon haalt een eigen ruis van 7 dB-A en maximaal niveau van 138 dB (zonder noemenswaardige vervorming). Deze zou met een vaste instelling een 23 bits AD-omzetter nodig hebben. Voor opnemen is 24 bit dus zeer geschikt.

    Dither is geen tovermiddel. Je kunt er niet nauwkeuriger mee opnemen, integendeel zelfs. Wat dan wel ?
    Dither wint nauwkeurigheid in het frequentiegebied waar ons oor het gevoeligst is, ten koste van nauwkeurigheid boven 10 kHz, waar ons oor minder gevoelig is. Akelig geknetter wordt vervangen door constante ruis waarin details beter te horen zijn.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *