På den ene siden har vi dem som anbefaler å bruke så høy oppløsning som mulig (eller i hvertfall minst 24 bit / 96 kilohertz sample rate). På den andre siden finner vi dem som mener at «CD-kvalitet» dvs 16 bit / 44,1 kilohertz holder, selv om de fleste bruker 24 bit. Hvis du skal samarbeide med andre er det meste fornuftig å bruke .wav filer, da dette er et format som alle kan åpne. (Hvis du f.eks. bruker Logic bør du sjekke at wav er valgt ved eksport, da standard er aif).
Hvorfor er man uenige ? Bakgrunnen for debatten er i korthet at det mangler «bevis» for at den høyeste samplingsfrekvensen (dvs mer enn 44,1 kHz) faktisk låter bedre. Grunnen til dette er at et teorem som kalles Nyquist-Shannon forenklet slår fast at et analogt signal kan gjenskapes perfekt dersom antall samplinger per sekund er dobbelt så høyt som den høyeste frekvensen i det analoge signalet. Når vi så vet at mennesker ikke kan høre frekvenser over 20 kilohertz skal jo 44,1 kilohertz holde godt og vel, vi er jo ikke flaggermus?!
Mange mener likevel at høyre frekvenser enn dette likevel gir bedre lydkvalitet, og trekker frem et antall mer eller mindre vitenskapelige undersøkelser. Det er ikke godt å si hva som er korrekt her. Det som er sikkert, er at eventuelle forskjeller i lydkvalitet mellom for eksempel 44,1 kHz og 96 kHz, er mindre enn forskjellen mellom 44,1 kHz og lavere samplingsfrekvenser.
«Kostnaden» for å bruke høyere samplingsfrekvens er økt belasning på datamaskinen. Når det gjelder bitdybde er alle enige om at 16 bit er OK´ish, men 24 bit er bedre – eller i hvert fall mer behagelig med hensyn til at man får et større headroom. Det betyr kort og godt at man slipper å være nøye med å styre ut signalet (ligge så nært opptil 0 dB ved innspilling som mulig uten å overstyre). Å bruke mer enn 24 bit er sløsing med dataressurser* når lydkortet ikke kan ta opp høyere enn 24 bit.
Forenklet kan man regne at hver bit tilsvarer 6 dB (desibel) i dynamisk omfang, slik at et 16 bits signal gir et teoretisk dynamisk omfang på 96 dB. Et 24 bits signal gir dermed et teoretisk omfang på 144 dB. Moderne konvertere kan likevel ikke gi bedre enn cirka 120 dB dynamisk omfang.
* Det finnes utstyr som kan ta opp i 32 bil float også. Hvis man f.eks. gjør felt-opptak og ikke kan stille opptaksnivåer, er det en måte å unngå utilsiktet clipping på. I hjemmestudioet derimot har man man god tid til å sette optimal gain, og materialet som skal tas opp er dynamisk ganske forutsigbart. Da vil 32 bit float gjerne bare være en måte å bruke mer diskplass på, uten at det gir noe tilbake.
Skal man forsøke seg på en slags konklusjon ut fra disse forholdene, anbefales en oppløsning på 24 bit og 44,1 kilohertz eller 48 kilohertz sample rate. Hvis du vet at du skal gå videre med låtene til streamingtjenester, kan det være verd å vite at de regel ha filer formatet 24 bit / 48 kHz, så da kan det være like greit å gjøre det helt fra starten når du begynner å spille inn. Et tips er å velge et format og holde seg til det helt konsekvent.