Sample rate 44.1, 48, 96 of zelfs 192 kHz
Hier wil ik het hebben over sample rate . De misverstanden hierover zijn vaak nog hardnekkiger dan die over bitdepth.
Eigenlijk ook niet zo verwonderlijk aangezien in veel
documentatie hierover (ook mijn eigen) weergave van digitaal audio als strairstep (getrapt) staan.
De juiste weergave voor bemonstering zou
echter punten moeten zijn.
Hierop wordt echter vaak gelijk de fout gemaakt
om de puntjes door een rechte lijn aan elkaar te verbinden.
En de lijnen zouden nog ‘rechter’ zijn als we minder samples tot ons beschikking hebben.
Hieruit zou dus ook snel de conclusie getrokken kunnen worden dat hoe fijner de bemonstering hoe vloeiender de overgangen. We benaderen het vaak als film. Hoe meer ‘foto’s’ we er van maken en deze achter elkaar afspelen hoe vloeiende het resultaat zal zijn. Maar zo werkt het niet bij audio.
Om een sinus* frequentie perfect weer te kunnen geven moeten we deze bemonsteren met een frequentie van minimaal twee keer zo groot. (Nyquist-Shannon bemonsteringstheorie) Dat is onze sample rate.
Frequenties hoger dan de helft van onze sample rate kunnen niet goed worden vast gelegd. Deze worden hierom dus ook, voor het samplen, er uitgefilterd. Dit betekent dat twee monsters maximaal de helft van onze sample frequentie kan vertegenwoordigen. (Niet hoger.)
Als u een rechte lijn tussen monster punten tekent maakt u eigenlijk een signaal, samengesteld uit vele sinusgolven, welke bij elkaar opgeteld vele malen hoger zouden moeten liggen dan de helft van de sample rate. Dat kan dus niet!
Als u dit nog steeds moeilijk vindt om te slikken, probeer het dan eens op een andere manier te zien. De reden dat een perfecte sinus wordt weergegeven, ook al heeft bemonstering niet de pieken gevangen, is dat een 19997Hz sinus de enige mogelijkheid is (bij een samplerate van 40kHz) welke alle monster punten doorloopt, maar niet een frequenties hoger dan Nyquist (de helft van onze sample rate) bevat. Een rechte lijn zou dit wel doen.
Hoe kan het de juiste piekniveaus (die hoger dan alle individueel monster kunnen zijn) herstellen? Dit is moeilijk te verklaren zonder een toevlucht tot wiskunde te nemen, maar in wezen zegt de Fourier theorie dat een complex continu veranderend signaal (wat audio is) gereproduceerd kan worden door een verzameling van sinusgolven van verschillende frequenties en amplitudes. Wanneer u al deze sinusgolven bij elkaar optelt, krijg je het originele signaal terug.
Het is dus belangrijk om de niet te samplen frequenties er uit te filteren. Doen we dit niet dan zullen de hoge frequenties ‘gezien’ worden als lagere frequenties (Aliasing*). In het analoog domain kunnen we niet stijl genoeg filteren waardoor er dan nog steeds (te) hoge frequenties zouden doorkomen.
Hierom werd 30 jaar geleden in digitaal studio’s op hoge sample rates opgenomen zodat men later tijdens het masteren de boel digitaal kon filteren. (Wellicht dat dit nog steeds bijdraagt aan het idee dat professioneel ook hoger sample rates betekent.) Tegenwoordig (eigenlijk al zeker de laatste 15 jaar) werken echter alle Analoog Digitaal Converters en Digitaal Analoog Converters intern met een zeer hoge sample rate en wordt er hierdoor ook intern digitaal perfect gefilterd.
Ok, maar welk sample rate hebben we nu dan nodig? Als we beseffen dat een mens niks boven de 20kHz kan horen (feit, net zo min als we infrarood kunnen zien) dan is een samplerate van 40kHz dus voldoende om alles perfect weer te geven (44.1 van een CD is dus mooi). Voor in onze studio is het fijn om nog wat extra samples te hebben aangezien we de boel nog gaan bewerken. (Meer data) Maar ook weer niet overdreven veel. 48kHz is dan weer ruim voldoende.
Besef ook dat veel apparatuur welke we in een studio gebruiken niet eens in staat is om hoger frequenties correct te registreren. (Microfoon van +2000 euro)
Je kunt zelfs discussiëren of het registreren van hogere frequenties niet juist averechts werkt. Ze veroorzaken ongewenste inter-modulatie vervorming in het hoorbaar gebied.
Kortom, al lijkt het dat meer beter is dit gaat dus niet altijd op. Sterker nog soms kan het teveel zijn. Dus voordat u (gewoon omdat het kan) met 96 of 192 kHz opneemt vraag u zelf eerst af wat u er mee wint. (Behalve grote bestanden en veel data om te verwerken.)
Notes:
*Sinus,
Ongeacht hoe gecompliceerd een signaal ook is zolang deze is samen te stellen uit meerdere sinus golven welke onder de helft van de sample frequentie ligt zal deze ook zo gereproduceerd worden.
Maar om compleet en accuraat te zijn even het volgende:
Een zaagtand of blok golf kan alleen perfect gereproduceerd worden met een oneindig aantal sinusgolven. Aangezien we door filtering geen oneindig aantal hebben kunnen dit soort golf vormen niet “perfect” gereproduceerd worden, al zijn deze afwijkingen wel heel klein en onhoorbaar. Dit maakt geen verschil tussen digitaal of analoog.
*Aliasing,
Als we een frequentie aanbieden welke hoger is dat de helft van de bemonstering frequentie kan deze niet goed gesampled worden. De frequentie zal in “spiegelbeeld” gereproduceerd worden. En dus hoe hoger de aangeboden frequentie is des te lager zal deze gereproduceerd worden.
Er kan met de monsters een ander frequentie (dan bedoeld) worden gemaakt.
U bent veel te optimistisch over Fourier en Nyquist.
Inderdaad, ieder signaal kan volgens Fourier opgebouwd worden uit een verzameling sinussen. Let wel, een oneindig grote verzameling (1) sinussen. Gelukkig mag je dan alle onhoorbaar hoge sinussen weglaten, maar het blijft een oneindig grote verzameling, tenzij je de duur van signaal drastisch inkort.
Neem bijvoorbeeld een viool die een toon van 441 Hz speelt. Bij bemonstering met 44,1 kHz kun je de golfvorm beschrijven met 100 getallen (monsters) of met 50 sinussen en 50 cosinussen (2)(met frequenties 441 Hz, 882 Hz, 1323 Hz, 1764 Hz, . . . tm 22050 Hz). Daarmee heb je 1 golfje beschreven. Speelt de viool 440 Hz, dan is het volgende golfje anders en heb je dus 100 andere getallen nodig. Houdt de toon 1 seconde aan, dan heb je 44100 getallen nodig. Dit kunnen 44100 monsters zijn of 441 groepjes van 100 sinussen. Grappig. Je beschrijft een toon van 1 seconde 440 Hz, door 441 verschillende combinaties van 441 Hz tonen en boventonen.
Enkele waarschuwingen:
– Zelfs met een perfecte AD omzetter is het NIET mogelijk om hoorbaar geluid perfect op te nemen. Het blijft een compromis, een keuze van de ontwerper. Wel is het mogelijk om geluid op te nemen zodat de imperfecties bij weergave onhoorbaar blijven. Vooral als de DA omzetter bij weergave weet wat de AD omzetter heeft gedaan bij opname.
– Niet alles beneden de Nyquist frequentie kan worden opgenomen. Er mag niets boven de Nyquist frequentie worden opgenomen. Daarvoor is het nodig te filteren (3) en dus geluid beneden de Nyquist frequentie ook aan te tasten.
– De getallen (monsters) van digitaal geluid zijn NIET de waarden van het analoge geluid op die momenten, immers er wordt gefilterd. Overigens ook niet bij weergave.
– Kwaliteitsverlies door slecht ontworpen AD en DA omzetters is veel groter dan de beperking van 44,1 kHz 16 bit cd-kwaliteit.
1) Set is Engels voor verzameling.
2) Een cosinus is ook een sinus, maar verschoven in de tijd. Met een combinatie van sinus en cosinus is iedere verschuiving ook te beschrijven. De hoeveelheid informatie is telkens hetzelfde, hier 100 getallen.
3) Filteren kan voor of tijdens de bemonstering. Vooraf (analoog) filteren is heel moeilijk en dus duur. Een simpel analoog filter in combinatie met heel grote overbemonstering maakt digitaal filteren mogelijk, met wiskundige nauwkeurigheid, en nog steeds compromissen.
De getoonde microfoon is erg duur en heeft een beperkt bereik in de hoge tonen. De standaard microfoon van hetzelfde merk komt tot ver boven 20 kHz en kost slechts een fractie. Voor 50 euro koop je een imitatie met een vlakke karakteristiek die ook gemakkelijk voorbij de 20 kHz komt.
De meest gebruikte microfoon in klassieke muziek komt tot 50 kHz.
Het grote frequentiebereik van condensatormicrofoons is vaak een gevolg van goede kwaliteit in de hoge tonen. Echter in combinatie met slechte AD-omzetters ook een bron van ellende. Waarschijnlijk een belangrijke reden voor antipathie tegen digitale techniek, en het overwaarderen van dynamische microfoons.
Bedankt voor je reacties en aanvullingen Baptist.
Voor wie echt meer de diepte in wil kan jou reacties lezen.