O przewagach zapisu i edycji dźwięku z rozdzielczością 24-bitową chyba nikogo nie trzeba przekonywać. Wystarczy powiedzieć, że na 1 bit rozdzielczości przypada 6 dB zakresu dynamiki, więc pliki 16-bitowe mogą mieć teoretyczny zakres dynamiki 96 dB, a pliki 24-bitowe już 144 dB. To oznacza, że rozpiętość dynamiczna między najcichszym sygnałem w materiale muzycznym (jest to zazwyczaj poziom szumów własnych wykorzystywanych urządzeń), a maksymalnym nieprzesterowanym sygnałem jest w przypadku tych drugich aż o 48 dB większa. Dzięki temu możemy rejestrować i przetwarzać dźwięk z niższym poziomem bez obawy o utratę jego dynamiki, mając jednocześnie duży zapas dla odpowiedniej prezentacji transjentów. Praca w 24, a nawet 32 bitach daje też więcej swobody na etapie miksowania, ponieważ dostępny zakres dynamiki znacząco przekracza ten sam parametr występujący nawet w najwyższej klasy sprzęcie audio.
Cóż z tego, kiedy na sam koniec nasza produkcja muzyczna i tak skończy jako plik w rozdzielczości 16-bitowej – czy to jako ścieżka na płycie CD, czy też jako MP3 dostępne w Internecie.
Aby plik produkcyjny, który ma zazwyczaj 24-bitową rozdzielczość, przekształcić do postaci 16-bitowej, trzeba usunąć w poszczególnych słowach bitowych, z których każde opisuje w systemie dwójkowym wartość poszczególnych próbek sygnału, 8 najmłodszych bitów. Najmłodszych, czyli tych, które odpowiadają za najniższe poziomy. Jeżeli je ot tak po prostu usuniemy za pomocą obcinania bitów (truncate), to w sygnale wynikowym braknie informacji o najcichszych składowych. W przypadku głośnych sygnałów będzie to oznaczało nieznaczną zmianę w ich brzmieniu, ale w przypadku tych cichszych, zwłaszcza wybrzmiewających, będzie już wyraźnie słychać zniekształcenia dźwięku.
Dlatego właśnie wymyślono dithering, czyli roztrząsanie, które może przyjmować różne formy. Najprostszą, choć nie uważaną za właściwy dithering, jest zaokrąglanie wartości poszczególnych sampli, które pozwala w pewnym zakresie złagodzić skutki prostego obcinania bitów. Bardziej zaawansowane formy ditheringu polegają na dodaniu specjalnie ukształtowanego szumu o bardzo niskim i zależnym od materiału dźwiękowego poziomie oraz składzie (niejako wplatając go w sygnał), który sumując się z najcichszymi dźwiękami w materiale 24-bitowym sprawia, że jego elementy składowe zostają niejako przeniesione do tych wartości, które nie będą podlegały redukcji bitów albo przesunięte w widmie sygnału poza zakres słyszalny.
Aby zaprezentować działanie algorytmu ditheringu niemalże jak pod mikroskopem, zmniejszyłem poziom oryginalnego 24-bitowego nagrania o 48 dB, a następnie fragment ten poddałem działaniu procesora PSP X-Dither (test w lutowym numerze magazynu Estrada i Studio) z różnymi ustawieniami, aplikując zmniejszenie rozdzielczości do 12 bitów. Pliki po poddaniu ditheringowi zostały następnie znormalizowane, aby można było lepiej usłyszeć różnice w działaniu algorytmów ditheringu.
Oczywiście w warunkach realnej pracy nikt nie będzie stosował tak skrajnych zabiegów, ale prezentacje te pozwolą lepiej zrozumieć, na czym polega dithering i jakie są efekty jego działania. Zaznaczam raz jeszcze – mamy tu do czynienia z ekstremalną sytuacją i ekstremalnie niekorzystnymi dla brzmienia warunkami. Przy rzeczywistej konwersji bitowej słyszane tu zjawiska odbywają się na poziomie praktycznie niesłyszalnym.
Świetny artykuł i świetny algorytm! Nic ująć, nic dodać 🙂