Tworzenie muzyki. Mastering - część 3

Poprzedni artykuł z naszego cyklu zakończyłem pytaniem, czy większa częstotliwość próbkowania, czyli dokonywania pomiarów poziomu sygnału analogowego w regularnych odcinkach czasu, pozwala na zwiększenie jakości konwersji sygnału analogowego na cyfrowy?

Okazuje się, że zwiększanie częstotliwości próbkowania nie ma aż tak dużego znaczenia jak rozdzielczość bitowa, czyli dokładność, z jaką pomiar poziomu analogowego konwertowany jest na postać binarną. Jeśli korzystamy z pomiaru 8-bitowego, czyli takiego, w którym analogowa wartość napięcia chwilowego wyrażona jest w postaci dwójkowej za pomocą liczby 8-pozycyjnej, to poruszamy się wówczas w zakresie liczb dwójkowych, od minimalnej 00000000 do maksymalnej 11111111.

Odtwarzacze płyt CD Audio wyposażone są w przetworniki C/A pracujące z częstotliwością próbkowania 44,1 kHz oraz 16-bitową rozdzielczością. Ta ostatnia pozwala uzyskać teoretyczną dynamikę rzędu 96 dB, podczas gdy dynamika orkiestry symfonicznej w pełnym składzie dochodzi do 110 dB. Mimo to wiele osób uważa dźwięk z dobrze nagranych płyt CD za całkowicie satysfakcjonujący.

Przekładając to na wartości dziesiętne, jesteśmy w stanie zdefiniować poziomy od 0 do 255 jednostek wyrażonych wyłącznie w liczbach całkowitych. Nawet jeśli owe jednostki będą miliwoltami, to najmniejszy możliwy do zaprezentowania w postaci binarnej poziom, czyli 00000001, będzie wynosił 1 mV. To jest ok. 0,4% maksymalnego sygnału, co stanowi wyrażoną w decybelach wartość -48 dB względem 0 dB będącego przyjętym przez nas poziomem maksymalnym.

Z powyższego wynika, że 8-decybelowa dokładność pomiaru jest w stanie oddać dźwięk z maksymalną dynamiką 48 dB, i to bez względu na to, jaką częstotliwość próbkowania zastosujemy. Nawet jeśli pomiary, czyli próbkowania sygnału, będą dokonywane bardzo gęsto, to i tak kolejne, znajdujące się blisko siebie wartości będą zaokrąglane, ponieważ przetwornik 8-bitowy nie będzie w stanie oddać niewielkich zmian w poziomie sygnału, z uwagi na to, że dysponuje tylko 255 jednostkami reprezentacji w postaci binarnej (28).

Więcej bitów!

Jeśli teraz zwiększymy dokładność konwersji z 8- do 16-bitowej, to maksymalny poziom, z jakim możemy zaprezentować sygnał analogowy w postaci binarnej, będzie wynosił 1111111111111111, czyli 65.535 wyrażony dziesiętnie (216). Załóżmy, że wyrazimy tę wielkość w mikrowoltach. Maksymalny poziom, który możemy przedstawić w postaci binarnej, będzie wówczas wynosił 65.535 mikrowoltów, czyli 65,535 miliwoltów, a minimalny (0000000000000001) - 1 mikrowolt, czyli 0,001 miliwolta. Ta najniższa wartość będzie wówczas stanowiła 0,00152590219 procent wartości maksymalnej, co w przeliczeniu na decybele daje wartość ok. -96 dB.

Program Steinberg WaveLab. screen. Przetwarzanie materiału audio

Do przetwarzania materiału audio pod względem konwersji bitowej, rozdzielczości oraz definiowania głośności odczuwalnej profesjonaliści korzystają z takich programów, jak np. Steinberg WaveLab.

W przypadku przeliczeń wartości procentowych na decybele, które - podobnie jak procenty - też są wyrażeniem proporcji, wartości powyżej 1 mają znak dodatni, a wartości poniżej 1 mają znak ujemny. To oznacza, że stosując przetwarzanie analogowo- cyfrowe z dokładnością 16-bitową, możemy teoretycznie uzyskać 96 dB dynamiki, czyli różnica między najcichszym przetworzonym sygnałem a najgłośniejszym wyniesie właśnie 96 dB - dokładnie tyle, ile zapewnia standardowa płyta CD Audio w formacie Red Book.

To całkiem nieźle, ale jeśli weźmiemy pod uwagę, że teoretyczny zakres dynamiki naszego słuchu wynosi 140 dB (w praktyce będzie to ok. 120-130 dB - w zależności od cech osobowych, ponieważ nasz słuch przy wyższych poziomach SPL zaczyna już aktywować swój wewnętrzny mechanizm kompresji i ograniczania), to wciąż za mało.

Dopiero wtedy, gdy zastosujemy przetworniki zdolne pracować z rozdzielczością 24-bitową, będziemy w stanie uzyskać teoretyczną dynamikę 144 dB, czyli pokrywającą z zapasem cały zakres głośności sygnałów muzycznych - od najcichszych dźwięków subtelnie wybrzmiewającego pogłosu do fortissimo possibile orkiestry symfonicznej w pełnym składzie.

Cicho, głośniej, najgłośniej

Z powyższego wynika, że możemy przyjąć, iż na każdy bit rozdzielczości przetwornika A/C przypada 6 dB zakresu dynamiki - dla 16 bitów będzie to 96 dB, a dla 32 bitów 192 dB. Nawiasem mówiąc, najgłośniejszy możliwy w znanej nam rzeczywistości dźwięk może mieć teoretyczny poziom ciśnienia dźwięku 194 dB SPL, rozerwanie błony bębenkowej w uchu następuje przy 180 dB SPL, wystrzał z karabinu to 165 dB SPL, a odgłos pracy silnika odrzutowego w odległości 30 metrów wynosi średnio 140 dB SPL.

Dodajmy też, że skala decybelowa dla ciśnienia dźwięku (dB SPL), jak każda tego typu, musi mieć jakiś poziom odniesienia, do którego porównujemy daną wartość poprzez zastosowanie proporcji i wyliczenie z niej algorytmu. Przyjęło się, że 0dB SPL odpowiada ciśnieniu dźwięku wynoszącemu 20 μPa (mikropaskali).

Dlaczego akurat tyle? Bo to najmniejszy poziom ciśnienia dźwięku, który jest w stanie wychwycić nasz słuch, tzw. próg słyszalności. Może się rodzić pytanie - skoro standardowa płyta CD oferuje nam 96 dB dynamiki i zdecydowanej większości osób na świecie to wystarcza, to dlaczego przy produkcji muzycznej pracujemy zazwyczaj z rozdzielczością 24 dB, a przy masteringu często z rozdzielczością 32-bitową?

Odtwarzacz płyt. Standard Super Audio CD bazujący na 1-bitowym przetwarzaniu

Na rynku już od wielu lat funkcjonuje standard Super Audio CD bazujący na 1-bitowym przetwarzaniu z próbkowaniem dochodzącym do kilku megaherców. Choć uważany jest on za najlepiej brzmiący format cyfrowego dźwięku, wciąż nie doczekał się (i chyba już nigdy nie doczeka) popularności, na jaką w pełni zasłużył.

Najciekawsze jest to, że zwiększanie rozdzielczości bitowej wcale nie służy do uzyskania większego poziomu maksymalnego, choć ma to oczywiście swoje istotne znaczenie. Chodzi tu głównie o jak najwierniejszą reprezentację... sygnałów najcichszych.

To właśnie one, umiejętnie wplecione w dźwięki głośniejsze, pozwalają w dużej mierze zdefiniować ogólny charakter brzmieniowy materiału muzycznego. Odczuwalna przez nas głośność i dynamika nagrania nie są bowiem definiowane poziomem maksymalnym, który możemy łatwo ustawić regulatorem głośności w naszym wzmacniaczu, ale różnicą między poziomem maksymalnym a poziomem średnim, czyli RMS. Dodatkowo pojawia się tu jeszcze cała gama innych czynników, które wpływają na tzw. głośność odczuwalną.

Bardzo trudno jest ją jednoznacznie zdefiniować, a najlepszym dowodem na to pozostaje fakt, że IBU (Międzynarodowa Unia Nadawców) dopiero dwa lata temu dopracowała się przyjęcia ogólnych założeń, które pozwoliły zdefiniować algorytm, na podstawie którego ma być dokonywany pomiar poziomu tejże głośności odczuwalnej. O tym jednak przeczytacie w następnym numerze naszego miesięcznika.

Tomasz Wróblewski