By the Sound Decibel Meter Team

Nauka o dźwięku: decybele, częstotliwości i słuch

Każdy odczyt miernika hałasu jest widzialnym końcem łańcucha łączącego fizykę, przetwarzanie sygnału i psychoakustykę. Zrozumienie tego łańcucha zmienia pytania, jakie się stawia. Przestają Państwo pytać „czy 90 dB to głośno?”, a zaczynają o to, co naprawdę się liczy: 90 dB względem jakiego odniesienia, z jakim filtrem ważącym, scałkowane w jakim oknie czasowym? Niniejsza strona omawia fizykę fal dźwiękowych, matematykę skali decybelowej, cztery standardowe ważenia częstotliwościowe, krzywe izofoniczne, całkowanie czasowe oraz analizę widmową przez FFT. Po jej przeczytaniu powinni Państwo umieć przeczytać każdą publikowaną wartość poziomu hałasu i wiedzieć dokładnie, co ona mówi, a czego nie.

To najgęstsza technicznie strona w witrynie. Czytają Państwo, by się czegoś nauczyć? Proszę przejść od góry do dołu. Szukają konkretnego pojęcia? Glosariusz wskaże właściwe sekcje.

Dźwięk to fala ciśnienia

Dźwięk to podłużna fala ciśnienia rozchodząca się w ośrodku sprężystym — zwykle w powietrzu. Drgające źródło spręża powietrze przed sobą i rozrzedza je, gdy się cofa, a wzór ten wędruje na zewnątrz z prędkością dźwięku (około 343 m/s w powietrzu w 20 °C, niżej w zimnym, wyżej w ciepłym lub w gęstszych ośrodkach jak woda).

Wielkością fizyczną, na którą reaguje mikrofon, jest ciśnienie — różnica między chwilowym ciśnieniem powietrza a stabilnym ciśnieniem atmosferycznym. Ciśnienie atmosferyczne wynosi około 101 325 Pa (101 kPa); najsłabszy dźwięk, który łapie młode, zdrowe ucho — próg słyszalności przy 1 kHz — to zmiana ciśnienia rzędu 20 mikropaskali (20 µPa), czyli 20 × 10⁻⁶ Pa. Próg bólu leży w okolicach 20 Pa, czyli milion razy wyżej.

Ten stosunek miliona w ciśnieniu uzasadnia logarytmiczną skalę decybelową. Praca w pascalach liniowo w tym zakresie daje liczby niewygodne (porównanie 0,00002 z 20). Logarytmiczne sprężenie daje 0 – 120 dB — znacznie łatwiej je zapisywać i o nich myśleć.

Fala ciśnieniowa ma trzy kluczowe deskryptory:

Amplituda — wielkość zmiany ciśnienia. Wiąże się z postrzeganą głośnością z silnymi nieliniowościami (patrz krzywe izofoniczne).
Częstotliwość — liczba cykli sprężania-rozrzedzania na sekundę, w hercach (Hz). Wiąże się z wysokością tonu, również nieliniowo.
Faza — w którym miejscu cyklu znajduje się fala w danej chwili. Przy pomiarach poziomu praktycznie nieistotna; ważna przy interferencji i układach wielomikrofonowych.

W przypadku czystego sygnału sinusoidalnego te trzy liczby opisują sygnał w pełni. Prawdziwy dźwięk niemal nigdy nie jest czystym tonem: to suma wielu składowych o różnych częstotliwościach, każda z własną amplitudą i fazą, zmieniających się w czasie.

Skala decybelowa

Decybel nie jest jednostką — to logarytmiczny stosunek dwóch wielkości, sprowadzony do użytecznej liczby przez stałe odniesienie w mianowniku. Dla poziomu ciśnienia akustycznego (SPL) standardowym odniesieniem jest 20 µPa. Dla zmierzonego ciśnienia p SPL w decybelach wyraża się:

L_p = 20 × log10( p / p_0 )       gdzie p_0 = 20 µPa

Współczynnik 20 (zamiast 10) bierze się stąd, że ciśnienie jest proporcjonalne do pierwiastka z natężenia, a decybel to stosunek mocy. Dla natężenia akustycznego:

L_I = 10 × log10( I / I_0 )       gdzie I_0 = 1 pW/m²

W polu swobodnym oba wzory dają tę samą liczbę i bez dalszych wyjaśnień używa się po prostu „dB”.

Z matematyki wynikają wprost trzy reguły praktyczne:

+3 dB podwaja energię akustyczną. Dwa identyczne nieskorelowane źródła (po 60 dB) sumują się do 63 dB, nie 66. Trzy identyczne — do 60 + 10 log10(3) ≈ 64,8 dB.
+10 dB to mniej więcej dwukrotnie głośniej dla człowieka. Dziesięciokrotny przyrost natężenia jest sprężany przez nieliniowość ucha do percepcyjnego współczynnika 2.
+6 dB podwaja ciśnienie, ale czterokrotnie zwiększa natężenie. Ważne dla odległości: źródło punktowe w polu swobodnym traci 6 dB SPL przy podwojeniu odległości.

Skala decybelowa ma też warianty, które potrafią wprawić w zakłopotanie nowicjuszy:

dB SPL — opisana wyżej skala ciśnienia. Standard w pomiarach akustycznych.
dB FS (decibel full scale) — używane w cyfrowym dźwięku. 0 dB FS to maksymalna możliwa cyfrowa wartość próbki; cała reszta jest ujemna. Bez kalibracji odniesienia nie da się wprost porównać z dB SPL.
dB SWL (sound power level) — bezwzględna moc emitowana przez źródło, niezależna od punktu pomiarowego. Używana w specyfikacjach urządzeń.
dBA / dBC / dBZ — ważenie A, C lub Z zastosowane do pomiaru dB SPL. Przy podawaniu liczby zawsze proszę dopisać ważenie.

Częstotliwość a wysokość

Ucho ludzkie reaguje na zmiany ciśnienia od około 20 Hz w basie do około 20 kHz w wysokich tonach, przy czym górna granica obniża się z wiekiem (typowy 60-latek słyszy do około 12 kHz). Poniżej 20 Hz mówi się o infradźwiękach (odczuwanych raczej niż słyszanych); powyżej 20 kHz — o ultradźwiękach (gwizdek dla psów wokół 25 kHz; ultrasonografia medyczna w megahercach).

Dwie skale przedziałów częstotliwości:

Oktawy — podwojenie częstotliwości. Z 100 do 200 Hz to jedna oktawa; z 200 do 400 Hz — kolejna. Pasmo słyszalne obejmuje około 10 oktaw.
Tercje (trzecio-oktawy) — trzy pasma na oktawę, tradycyjnie używane w akustyce, bo zbliżają się do rozdzielczości częstotliwościowej ucha. ISO 266 ustala standardowe częstotliwości środkowe (…100, 125, 160, 200, 250, 315, 400…).

Prawdziwe dźwięki mają zawartość szerokopasmową: odkurzacz rozprowadza energię na wielu pasmach, podczas gdy kamerton skupia się na jednej częstotliwości. Większość hałasu środowiskowego jest szerokopasmowa; większość nut muzycznych jest pseudo-tonalna (częstotliwość podstawowa plus alikwoty).

Ważenia częstotliwościowe

Ucho ludzkie nie jest jednakowo czułe na wszystkie częstotliwości — daleko mu do tego. Ton 60 dB przy 1 kHz brzmi dużo głośniej niż ton 60 dB przy 50 Hz, bo ucho jest najbardziej czułe w środku pasma i znacznie mniej w basie (i nieco mniej powyżej 5 kHz).

Mikrofon pomiarowy jest z założenia płaski: jego elektryczne wyjście jest proporcjonalne do ciśnienia akustycznego w całym paśmie słyszalnym. Ta płaskość jest właściwym punktem startu, ale oznacza, że surowy pomiar nie oddaje sposobu, w jaki człowiek odbiera dźwięk. By wypełnić tę lukę, mierniki nakładają przed obliczeniem poziomu filtr ważący częstotliwościowo.

Cztery ważenia są znormalizowane w IEC 61672‑1, historycznie nazwane literami:

Ważenie A

Przybliża odwrotność krzywej izofonicznej 40 fonów. Mocno tłumi bas (ok. −30 dB przy 50 Hz, −40 dB przy 20 Hz) i lekko powyżej 6 kHz; pozostaje niemal płaskie w paśmie 1 – 5 kHz, gdzie ucho jest najbardziej czułe. Stosowane do niemal całego hałasu BHP i środowiskowego (NIOSH, OSHA, WHO, ISO 1996, dyrektywa UE 2003/10/WE; w Polsce — rozporządzenie MRPiPS NDN).

Postać matematyczna to filtr analogowy o 4 biegunach i 4 zerach:

R_A(f) = (12194² × f⁴) / [ (f² + 20,6²) × √((f² + 107,7²)(f² + 737,9²)) × (f² + 12194²) ]
A(f) = 20 × log10( R_A(f) ) + 2,00 dB

Przesunięcie +2,00 dB normalizuje A do 0 dB przy 1 kHz.

Ważenie C

Znacznie płaskie niż A. Tłumi tylko na końcach pasma słyszalnego (ok. −3 dB przy 31,5 Hz i 8 kHz; ok. −0,2 dB przy 50 Hz). Używane przy pomiarach szczytowych (gdzie rzeczywista energia szczytu liczy się bardziej niż postrzegana głośność), przy źródłach z mocnym basem — koncerty, subwoofery, grzmoty — i historycznie przy wysokich poziomach, gdzie odpowiedź ucha jest bliższa krzywej 40 – 100 fonów niż 40-fonowej, którą przybliża A.

Ważenia B i D

B było ważeniem pośrednim dla średnich poziomów (50 – 60 fonów). D było specyficzne dla hałasu lotniczego. Współczesne normy je wycofały; rzadko się je dziś spotyka.

Ważenie Z

Zerowe — płaska odpowiedź od 10 Hz do 20 kHz. Stosowane w badaniach i przy weryfikacji przyrządów. Zastępuje starsze „liniowe” lub „nieważone”, które nie było spójne między producentami.

W razie wątpliwości: A. Jeśli mierzą Państwo coś, czemu dominuje bas, warto podać też C; sama różnica między A a C jest diagnostyczna co do zawartości widmowej.

Krzywe izofoniczne

Częstotliwościowa zależność słuchu człowieka to nie pojedyncza krzywa — zmienia się z poziomem. Przy niskim SPL czułość na bas jest mała; przy wysokim SPL krzywa się spłaszcza.

Klasyczne dane eksperymentalne pochodzą od Fletchera i Munsona (1933), ze współczesnymi rewizjami znormalizowanymi w ISO 226:2003. Obie dają rodzinę krzywych, z których każda jest oznaczona wartością w fonach, gdzie fon to SPL tonu 1 kHz odbieranego jako równie głośny jak ton testowy. Krzywa 40 fonów wskazuje więc, jakie SPL na każdej częstotliwości jest potrzebne, by brzmiało równie głośno jak ton 40 dB SPL przy 1 kHz.

Praktyczne konsekwencje:

Ważenie A modeluje krzywą 40 fonów, więc jest dokładniejsze przy poziomach średnich (40 – 60 dB SPL). Przy wysokich (> 90 dB SPL) A zaniża bas wobec rzeczywistej odpowiedzi ucha.
Fon to jednostka poziomu głośności, a nie samej głośności.
Son to jednostka postrzeganej głośności, zdefiniowana tak, by podwojenie sonów odpowiadało podwojeniu postrzeganej głośności. 1 son = 40 fonów. 2 sony = 50 fonów (reguła „+10 fonów = dwa razy głośniej”).

Całkowanie czasowe

Mikrofon dostarcza tysiące razy na sekundę chwilową wartość ciśnienia. Raportowanie pojedynczej próbki jako „poziomu” jest bezużyteczne — mierniki obliczają ważoną w czasie wartość RMS w wybranej stałej całkowania:

p_rms(t) = sqrt( (1/τ) × integral( p²(s) × e^(-(t-s)/τ) ) ds )

Stała czasowa τ decyduje o szybkości reakcji:

Fast (F) — τ = 125 ms. Domyślne dla pomiarów BHP i środowiskowych.
Slow (S) — τ = 1000 ms. Dla stabilnego hałasu otoczenia.
Impulse (I) — τ_atak = 35 ms, τ_opadanie = 1500 ms. Wyłapuje krótkie transjenty (strzały, uderzenia młotka).

Dla hałasu silnie zmiennego w czasie ważone w czasie SPL miga. Większość norm używa zamiast tego równoważnego poziomu ciągłego (Leq lub LAeq dla A) — stałego SPL, który dostarcza tej samej całkowitej energii akustycznej co rzeczywisty zmienny sygnał:

LAeq,T = 10 × log10( (1/T) × integral( 10^(LA(t)/10) ) dt )

Leq jest energetycznie równoważne, sumowalne w czasie i jest podstawą każdej współczesnej normy BHP czy środowiskowej. Przy hałasie sąsiedzkim spotyka się też inne deskryptory statystyczne:

L10, L50, L90 — poziom przekroczony przez 10 %, 50 %, 90 % okresu pomiaru. L10 to „typowy szczyt”, L90 „tło”.
Lden — ważona 24-godzinna średnia w europejskich mapach hałasu. Wieczór +5 dB, noc +10 dB. W Polsce wskaźnik wykorzystywany m.in. w mapach akustycznych aglomeracji zgodnie z ustawą Prawo ochrony środowiska.
Lmax, Lpeak — maksima w obrębie zdarzenia. Lmax jest ważone czasowo; Lpeak to chwilowy nieważony szczyt.

FFT i analiza widmowa

Falę ciśnienia w dziedzinie czasu można przejść w dziedzinę częstotliwości za pomocą szybkiej transformaty Fouriera (FFT). FFT bierze okno próbek i daje zespolone widmo z amplitudą i fazą na każde pasemko częstotliwości.

Kilka właściwości, które warto znać:

Rozdzielczość pasemka = częstotliwość próbkowania / rozmiar FFT. 48 kHz z FFT o 2048 punktach daje 23,4 Hz na pasemko — wystarczająco dla muzyki i mowy, zbyt zgrubne dla analizy niskoczęstotliwościowej, gdzie potrzebna bywa rozdzielczość 1 Hz.
Funkcja okna — pomnożenie próbek czasowych przez okno (Hann, Hamming, Blackman, Kaiser) przed FFT zmniejsza wyciek widmowy kosztem szerszych płatków głównych. Nasz wizualizer używa okna Hanna.
Niepewność czas-częstotliwość. Szersze okna FFT dają lepszą rozdzielczość częstotliwości, ale gorszą czasową. Obu naraz nie da się — Heisenberg w akustyce.

Dla pomiarów BHP i środowiskowych analiza pasm tercjowych jest praktyczniejsza niż wąskopasmowe FFT. Analizator tercjowy grupuje pasemka FFT w pasma sensowne percepcyjnie (zbliżone do tego, co rozdziela ucho), co czyni widmo czytelnym i porównywalnym ze standardowymi krzywymi oceny (NC, RC, NR).

Wizualizer miernika pokazuje wąskopasmowe FFT jako narzędzie diagnostyczne — źródła tonalne pojawiają się jako odosobnione szczyty. Do formalnej analizy częstotliwościowej proszę użyć SLM klasy 2 z wbudowaną analizą tercjową.

Powrót do miernika

Każda liczba z miernika to wynik:

Próbkowania ciśnienia powietrza przy mikrofonie (strona kalibracji opisuje, co tu może pójść nie tak).
Zastosowania ważenia A na sygnale cyfrowym (lub C, lub Z, zależnie od ustawień).
Podniesienia do kwadratu, ważenia czasowego (Fast / Slow / Impulse), pierwiastkowania w celu uzyskania ciśnienia RMS.
Obliczenia 20 × log10 ze stosunku do 20 µPa.
Dodania użytkownikowego calibration offset.

Znajomość łańcucha nie zmieni odczytów, ale wyjaśnia, dlaczego dwa mierniki mogą się różnić: inna kalibracja mikrofonu, inne ważenie, inne czasy całkowania, inne wartości referencyjne. Gdy liczby się nie zgadzają, odpowiedź niemal zawsze leży gdzieś w tym łańcuchu.

W praktycznej interpretacji odczytów — co jest głośne, co bezpieczne, jakie przepisy obowiązują — proszę zajrzeć do tabeli porównawczej, na stronę o zdrowiu słuchu i na stronę o pracy. Po definicje pojęć — glosariusz odsyła z powrotem do tej strony.

Open the decibel meter