Наука про звук: децибели, частоти і слух
Кожен показ шумоміра — це видимий кінець ланцюга фізики, обробки сигналу і психоакустики. Розуміння цього ланцюга змінює питання. Ви припиняєте питати «90 дБ — гучно?» і починаєте те, що справді важить: 90 дБ відносно якого еталона, з яким зважувальним фільтром, інтегроване в якому часовому вікні? Ця сторінка охоплює фізику звукових хвиль, математику децибельної шкали, чотири стандартні частотні зважування, ізофонічні криві, часову інтеграцію і спектральний аналіз через FFT. Наприкінці Ви маєте читати будь-яку опубліковану цифру шуму і точно знати, що вона каже і чого не каже.
Це найгустіша технічно сторінка сайту. Читаєте, щоб навчитися, — ідіть зверху вниз. Шукаєте конкретне поняття — глосарій скеровує до правильних розділів.
Звук — це хвиля тиску
Звук — це поздовжня хвиля тиску, що поширюється у пружному середовищі — зазвичай у повітрі. Джерело, що коливається, стискає повітря перед собою і розріджує його, відходячи назад, і ця картина стиснення-розрідження мандрує назовні зі швидкістю звуку (приблизно 343 м/с у повітрі при 20 °C, нижче в холодному повітрі, вище в теплому або щільнішому середовищі, як вода).
Фізична величина, на яку реагує мікрофон, — це тиск: різниця між миттєвим локальним тиском повітря та стабільним атмосферним. Атмосферний тиск близько 101 325 Па (101 кПа); найслабший звук, який ловить молоде здорове вухо — поріг чутності на 1 кГц — це коливання тиску близько 20 мікропаскалів (20 мкПа), тобто 20 × 10⁻⁶ Па. Поріг болю — близько 20 Па, у мільйон разів вище.
Це мільйонне співвідношення в тиску мотивує логарифмічну децибельну шкалу. Робота в лінійних паскалях у такому діапазоні дає некомфортні цифри (порівняйте 0,00002 з 20). Логарифмічне стискання дає 0 – 120 дБ, набагато простіше для запису і роздумів.
Хвиля тиску має три ключові дескриптори:
- Амплітуда — величина коливання тиску. Пов’язана з відчутою гучністю, з сильними нелінійностями (див. ізофонічні криві).
- Частота — кількість циклів стиснення-розрідження за секунду, у герцах (Гц). Пов’язана з висотою тону, теж нелінійно.
- Фаза — де хвиля зараз у своєму циклі. Для вимірів рівня практично нерелевантна; важлива при інтерференції та багатомікрофонних установках.
Для чистого синуса ці три числа повністю описують сигнал. Реальний звук майже ніколи не є чистим тоном: це сума багатьох компонентів на різних частотах, кожен зі своєю амплітудою і фазою, що безперервно змінюються в часі.
Децибельна шкала
Децибел не є одиницею — це логарифмічне співвідношення між двома величинами, перетворене на корисне число фіксованим еталоном у знаменнику. Для рівня звукового тиску (SPL) еталон — 20 мкПа. Для виміряного тиску p SPL у децибелах:
L_p = 20 × log10( p / p_0 ) де p_0 = 20 мкПа
Множник 20 (а не 10) — бо тиск пропорційний кореню з інтенсивності, а децибел — це співвідношення потужності. Для акустичної інтенсивності:
L_I = 10 × log10( I / I_0 ) де I_0 = 1 пВт/м²
У вільному полі обидві формули дають однакове число, і пишуть просто «дБ» без подальших пояснень.
Три правила великого пальця випливають прямо з математики:
- +3 дБ подвоюють акустичну енергію. Два однакові некорельовані джерела (по 60 дБ) дають у сумі 63 дБ, не 66. Три однакові — 60 + 10 log10(3) ≈ 64,8 дБ.
- +10 дБ — приблизно вдвічі гучніше для людини. Десятикратне збільшення інтенсивності стискається нелінійністю вуха до перцепційного коефіцієнта 2.
- +6 дБ подвоюють тиск, але вчетверо збільшують інтенсивність. Важливо для відстані: точкове джерело у вільному полі втрачає 6 дБ SPL при подвоєнні відстані.
Децибельна шкала має й варіанти, що збивають новачків:
- дБ SPL — шкала тиску, описана вище. Стандарт у акустичних вимірах.
- дБ FS (decibel full scale) — у цифровому аудіо. 0 дБ FS — максимально можливе цифрове значення семпла; усе інше — від’ємне. Без референтного калібрування не порівнюється напряму з дБ SPL.
- дБ SWL (sound power level) — абсолютна потужність, яку випромінює джерело, незалежно від точки виміру. Використовується у специфікаціях обладнання.
- дБА / дБC / дБZ — A-, C- або Z-зважування, накладене на вимір дБ SPL. Завжди вказуйте зважування разом із цифрою.
Частота і висота
Людське вухо реагує на коливання тиску від близько 20 Гц у басі до близько 20 кГц у верхах, при чому верхня межа знижується з віком (типовий 60-річний чує до 12 кГц). Нижче 20 Гц — інфразвук (радше відчувається, ніж чується); вище 20 кГц — ультразвук (свисток для собак — близько 25 кГц; медичне УЗД — у мегагерцях).
Дві шкали для частотних інтервалів:
- Октави — подвоєння частоти. Від 100 до 200 Гц — одна октава; від 200 до 400 Гц — ще одна. Чутний діапазон — близько 10 октав.
- Третинно-октавні смуги — три смуги на октаву, традиційні в акустиці, бо наближаються до частотного розділення вуха. ISO 266 фіксує стандартні центральні частоти (…100, 125, 160, 200, 250, 315, 400…).
Реальні звуки мають широкосмуговий вміст: пилосос розподіляє енергію на багато смуг, а камертон зосереджується на одній частоті. Більшість шуму довкілля широкосмугова; більшість музичних нот псевдотональні (основна частота плюс гармоніки).
Частотні зважування
Людське вухо нерівно чутливе до різних частот — далеко не рівно. Тон 60 дБ на 1 кГц звучить набагато гучніше, ніж тон 60 дБ на 50 Гц, бо вухо найчутливіше посередині й набагато менше — у басі (і трохи менше — вище 5 кГц).
Вимірювальний мікрофон за конструкцією плаский: його електричний вихід пропорційний акустичному тиску в усьому чутному діапазоні. Така пласкість — правильна стартова точка, але це означає, що сирий вимір не передає того, як людина сприймає звук. Щоб закрити цей розрив, шумоміри накладають перед обчисленням рівня частотний зважувальний фільтр.
Чотири зважування стандартизовані в IEC 61672‑1, історично названі літерами:
A-зважування
Наближає інверсію ізофонічної кривої на 40 фон. Сильно ослаблює бас (близько −30 дБ на 50 Гц, −40 дБ на 20 Гц) і трохи — вище 6 кГц; майже пласке у 1 – 5 кГц, де вухо найчутливіше. Використовується майже для всього виробничого і довкільного шуму (NIOSH, OSHA, WHO, ISO 1996, ЄС 2003/10/ЄС, в Україні — ДСН 3.3.6.037-99).
Математична форма — аналоговий фільтр із 4 полюсами та 4 нулями:
R_A(f) = (12194² × f⁴) / [ (f² + 20,6²) × √((f² + 107,7²)(f² + 737,9²)) × (f² + 12194²) ]
A(f) = 20 × log10( R_A(f) ) + 2,00 дБ
Зміщення +2,00 дБ нормалізує A на 0 дБ при 1 кГц.
C-зважування
Набагато пласкіше, ніж A. Ослаблює лише на краях чутного діапазону (близько −3 дБ на 31,5 Гц і 8 кГц; близько −0,2 дБ на 50 Гц). Використовується при пікових вимірах (де реальна енергія піку важить більше за відчуту гучність), при басистих джерелах — концерти, сабвуфери, грім — і історично при високих рівнях, де частотна характеристика вуха ближча до кривої 40 – 100 фон, ніж до 40-фонної, яку наближає A.
B- і D-зважування
B було проміжним зважуванням для середніх рівнів (50 – 60 фон). D — спеціально для авіаційного шуму. Сучасні норми їх скасували; зустрінути їх сьогодні рідко.
Z-зважування
Нуль-зважування — пласка характеристика від 10 Гц до 20 кГц. Використовується для досліджень і перевірки приладів. Замінює старіше «лінійне» або «нещиткане», що не було узгодженим між виробниками.
При сумніві: A. Якщо міряєте щось, що домінується басом, вкажіть і C; різниця між A і C сама по собі діагностична для спектрального вмісту.
Ізофонічні криві
Частотна залежність людського слуху — не одна крива; вона змінюється з рівнем. На низьких SPL Ви мало чутливі до басу; на високих SPL крива згладжується.
Класичні експериментальні дані від Флетчера і Мансона (1933), із сучасними переглядами, стандартизованими в ISO 226:2003. Обидва дають родину кривих, кожна позначена значенням у фонах, де фон — це SPL тону 1 кГц, який сприймається таким же гучним, як тестовий. Крива 40 фон, отже, показує, який SPL потрібен на кожній частоті, щоб звучати так само гучно, як тон 40 дБ SPL на 1 кГц.
Кілька практичних висновків:
- A-зважування моделює криву 40 фон, тож воно точніше на середніх рівнях (40 – 60 дБ SPL). На високих рівнях (> 90 дБ SPL) A недооцінює бас порівняно з тим, як вухо насправді реагує.
- Фон — одиниця рівня гучності, не сама гучність.
- Сон — одиниця сприйнятої гучності, визначена так, що подвоєння сонів відповідає подвоєнню сприйнятої гучності. 1 сон = 40 фон. 2 сони = 50 фон (правило «+10 фон = удвічі гучніше»).
Часова інтеграція
Мікрофон тисячі разів за секунду видає миттєве значення тиску. Подавати один семпл як «рівень» безглуздо — шумоміри обчислюють зважений у часі RMS на обраній сталій інтеграції:
p_rms(t) = sqrt( (1/τ) × integral( p²(s) × e^(-(t-s)/τ) ) ds )
Стала часу τ визначає швидкість реакції:
- Fast (F) —
τ = 125 мс. Стандарт для виробничих і довкільних вимірів. - Slow (S) —
τ = 1000 мс. Для стабільного шуму оточення. - Impulse (I) —
τ_атака = 35 мс,τ_спад = 1500 мс. Ловить короткі транзієнти (постріли, удари молотка).
Для сильно змінного у часі шуму зважений у часі SPL миготить. Більшість норм використовують натомість безперервний еквівалентний рівень (Leq або LAeq для A) — сталий SPL, що дає таку саму повну акустичну енергію, як справді змінний сигнал:
LAeq,T = 10 × log10( (1/T) × integral( 10^(LA(t)/10) ) dt )
Leq — енергетично еквівалентний, додатковий у часі, і основа кожної сучасної норми щодо виробничого чи довкільного шуму. Для громадського шуму іноді бачите інші статистичні дескриптори:
- L10, L50, L90 — рівень, перевищений 10 %, 50 %, 90 % часу виміру. L10 — «типовий пік»; L90 — «фон».
- Lden — зважене 24-годинне середнє для шумових карт ЄС. Вечір +5 дБ, ніч +10 дБ. В Україні близький підхід застосовується у міських акустичних картах.
- Lmax, Lpeak — максимуми за подію. Lmax — зважений у часі; Lpeak — миттєвий незважений пік.
FFT і спектральний аналіз
Хвильову форму тиску у часовій області можна перевести у частотну за допомогою швидкого перетворення Фур’є (FFT). FFT бере вікно семплів і дає комплексний спектр з амплітудою і фазою на кожен частотний bin.
Кілька властивостей, які варто знати:
- Роздільність bin = частота вибірки / розмір FFT. 48 кГц із FFT на 2048 точок дає 23,4 Гц на bin — добре для музики й мови, грубо для низькочастотного аналізу, де може потребуватись 1 Гц роздільності.
- Віконна функція — множення часових семплів на вікно (Hann, Hamming, Blackman, Kaiser) перед FFT зменшує спектральне просочування ціною ширших головних пелюсток. Наш візуалізатор використовує вікно Hann.
- Часова-частотна невизначеність. Ширші вікна FFT дають кращу частотну роздільність, але гіршу часову. Обидва водночас неможливі — Гайзенберг, застосований до акустики.
Для виробничих і довкільних вимірів аналіз третинно-октавних смуг корисніший за вузькосмугову FFT. Аналізатор третин групує биніси FFT у перцепційно осмислені смуги (приблизно те, що розрізняє вухо), що робить спектр зручним для читання і порівняння зі стандартними оцінювальними кривими (NC, RC, NR).
Візуалізатор шумоміра показує вузькосмуговий FFT як діагностичний інструмент — тональні джерела з’являються як ізольовані піки. Для формального частотного аналізу — використовуйте SLM класу 2 з інтегрованими третинами.
Назад до шумоміра
Кожне число з шумоміра — результат:
- Семплування тиску повітря на мікрофоні (сторінка калібрування розглядає, що тут може піти не так).
- Накладення A-зважування на цифровий сигнал (або C, або Z, залежно від налаштувань).
- Піднесення до квадрата, зважування за часом (Fast / Slow / Impulse), добування кореня для отримання RMS-тиску.
- Обчислення 20 × log10 співвідношення до 20 мкПа.
- Додавання користувацького calibration offset.
Знання ланцюга не змінює покази, але пояснює, чому два шумоміри можуть розходитися: різне калібрування мікрофона, різні зважування, різні часи інтеграції, різні еталонні значення. Коли цифри не сходяться, відповідь майже завжди десь у цьому ланцюгу.
Для практичного тлумачення показів — що вважати гучним, що безпечно, які норми діють — зверніться до таблиці порівнянь, сторінки про здоров’я слуху і сторінки про роботу. Для визначень понять глосарій — зворотний індекс до цієї сторінки.