Наука о звуке: децибелы, частоты и слух — объяснение
Каждое показание шумомера — видимый конец цепочки физики, обработки сигналов и психоакустики. Понимание этой цепочки делает показания полезными — Вы перестаёте спрашивать «90 dB — это громко?» и начинаете задавать более полезные вопросы: 90 dB по сравнению с какой опорой, через какой фильтр коррекции, интегрировано на каком временном окне. Эта страница проходит через физику звуковых волн, математику шкалы децибелов, четыре стандартные частотные коррекции, кривые равной громкости, временную интеграцию и спектральный анализ FFT. К концу Вы должны уметь читать любую опубликованную цифру шума и точно знать, что она значит и не значит.
Это самая длинная техническая страница сайта. Если Вы пришли учиться — читайте сверху вниз. Если ищете конкретное понятие — глоссарий перекрёстно ссылается на соответствующий раздел этой страницы для каждого термина.
Звук — это волна давления
Звук — продольная волна колебаний давления, распространяющаяся через упругую среду — обычно через воздух. Колеблющийся источник сжимает воздух перед собой, затем разрежает его при движении назад, и эта картина «сжатие-разрежение» уходит наружу со скоростью звука (примерно 343 m/s в воздухе при 20 °C, медленнее в холодном, быстрее в тёплом или более плотных средах вроде воды).
Физическая величина, на которую отвечает микрофон, — давление: разность между мгновенным локальным давлением воздуха и стабильным атмосферным. Атмосферное давление — около 101 325 Pa (101 kPa); самый тихий звук, который различает молодое здоровое ухо — порог слышимости на 1 kHz — это колебание давления около 20 микропаскалей (20 µPa), или 20 × 10⁻⁶ Pa. Порог боли — около 20 Pa, в миллион раз больше.
Это соотношение в миллион в давлении — мотивация логарифмической шкалы децибелов. Работа с линейными паскалями в этом диапазоне даёт неудобные числа (сравните 0,00002 и 20). Логарифмическое сжатие даёт 0 dB до 120 dB — гораздо удобнее писать и осмысливать.
У волны давления три ключевых дескриптора:
- Амплитуда — величина колебания давления. Связана с громкостью с сильной нелинейностью (см. равные громкости ниже).
- Частота — число циклов «сжатие-разрежение» в секунду, в герцах (Hz). Связана с высотой тона, тоже с нелинейностью.
- Фаза — где в цикле волна сейчас. В большинстве своём не важна для измерений уровня, важна для интерференции и многомикрофонных схем.
Для чистой синусоиды эти три числа полностью описывают сигнал. Реальные звуки почти никогда не чистые тоны — это суммы многих компонент на разных частотах, у каждой своя амплитуда и фаза, меняющиеся непрерывно во времени.
Шкала децибелов
Децибел — не единица, а логарифмическое отношение между двумя величинами, превращённое в полезное число благодаря фиксированному знаменателю. Для уровня звукового давления (SPL) стандартная опора — 20 µPa. При измеренном давлении p SPL в децибелах:
L_p = 20 × log10( p / p_0 ) где p_0 = 20 µPa
Множитель 20 (а не 10) — потому что давление пропорционально корню из интенсивности, а децибел — это отношение мощности. Для акустической интенсивности:
L_I = 10 × log10( I / I_0 ) где I_0 = 1 pW/m²
В свободном поле обе формулы дают одно и то же число, поэтому большинство людей использует их взаимозаменяемо, и «dB» — осмысленный ответ без уточнения.
Три эмпирических правила прямо из математики:
- +3 dB удваивают акустическую энергию. Два одинаковых некогерентных источника (по 60 dB каждый) дают в сумме 63 dB, а не 66 dB. Три одинаковых — 60 + 10 log10(3) ≈ 64,8 dB.
- +10 dB ≈ ×2 в субъективной громкости. Десятикратный рост интенсивности сжимается до примерно двукратной воспринимаемой громкости из-за нелинейности слуха.
- +6 dB удваивают давление, добавляя при этом в 4 раза больше интенсивности. Это важно для расстояния: точечный источник в свободном поле, удваивая дистанцию, теряет 6 dB SPL.
У шкалы есть варианты, путающие новичков:
- dB SPL — описанная выше шкала давления. По умолчанию для акустических измерений.
- dB FS (decibel full scale) — в цифровом аудио. 0 dB FS — максимальный представимый сэмпл; всё остальное отрицательное. Прямо с dB SPL без эталонной калибровки не сравнивается.
- dB SWL (sound power level) — абсолютная мощность, излучаемая источником, независимо от того, где меряете. Используется в спецификациях оборудования.
- dBA / dBC / dBZ — A, C или Z коррекция, применённая к измерению dB SPL. Всегда указывайте коррекцию рядом с числом.
Частота и высота тона
Человеческое ухо отвечает на колебания давления примерно от 20 Hz на нижнем конце до примерно 20 kHz на верхнем, причём верхний предел стабильно снижается с возрастом (типичный 60-летний слышит примерно до 12 kHz). Ниже 20 Hz — инфразвук (скорее ощущается, чем слышится); выше 20 kHz — ультразвук (свисток для собак — около 25 kHz; медицинский ультразвук — в диапазоне мегагерц).
Для измерения частотных интервалов используются две шкалы:
- Октавы — удвоение частоты. 100 Hz – 200 Hz — одна октава; 200 Hz – 400 Hz — следующая. Слышимый диапазон — примерно 10 октав.
- Третьоктавные полосы — три полосы на октаву, традиционные в акустических измерениях, потому что приближают частотное разрешение уха. ISO 266 определяет стандартные центральные частоты (...100, 125, 160, 200, 250, 315, 400...).
Реальные звуки имеют широкополосное содержание: пылесос — энергия по многим полосам; камертон — сосредоточена на одной частоте. Большинство средового шума широкополосное; большинство музыкальных нот квазитональные (основной тон плюс гармоники).
Частотные коррекции
Человеческое ухо не одинаково чувствительно ко всем частотам — далеко нет. Тон 60 dB на 1 kHz звучит ощутимо громче, чем тон 60 dB на 50 Hz, потому что ухо чувствительнее в средней зоне и заметно менее в нижней (и несколько менее выше ~5 kHz).
Измерительный микрофон по концепции плоский — его электрический выход пропорционален давлению по всему слышимому диапазону. Это правильная исходная точка, но это означает, что необработанное измерение не отражает то, как слушатель воспринимает звук. Чтобы преодолеть разрыв, шумомеры применяют фильтр частотной коррекции перед расчётом уровня.
Четыре коррекции стандартизованы в IEC 61672‑1, исторически именованы буквами:
A-коррекция
Аппроксимирует обратную кривую равной громкости 40 фон. Сильно ослабляет частоты ниже 500 Hz (около −30 dB на 50 Hz, −40 dB на 20 Hz) и слегка выше 6 kHz; почти плоская в диапазоне 1 – 5 kHz, где ухо самое чувствительное. Используется почти во всём профессиональном и средовом шуме (NIOSH, OSHA, WHO, ISO 1996, ЕС 2003/10).
Математическая форма — аналоговый фильтр с 4 полюсами и 4 нулями:
R_A(f) = (12194² × f⁴) / [ (f² + 20.6²) × √((f² + 107.7²)(f² + 737.9²)) × (f² + 12194²) ]
A(f) = 20 × log10( R_A(f) ) + 2.00 dB
Сдвиг +2,00 dB нормирует A-коррекцию на 0 dB при 1 kHz.
C-коррекция
Намного более плоская, чем A. Ослабляет только в крайних точках слышимого диапазона (около −3 dB на 31,5 Hz и на 8 kHz; около −0,2 dB на 50 Hz). Используется для измерений пика (где важна реальная пиковая энергия, а не воспринимаемая громкость), для низкочастотных источников: концертов, сабвуферов, грома, и исторически для громких звуков, где частотный отклик уха ближе к контуру 40 – 100 фон, чем к 40-фоновому, который аппроксимирует A.
B и D коррекции
B — промежуточный уровень, рассчитан на умеренные уровни (50 – 60 фон). D — специфична для авиашума. Обе устарели по современным стандартам и редко встречаются.
Z-коррекция
Нулевая — плоский отклик от 10 Hz до 20 kHz. Используется в исследованиях и верификации приборов. Заменила старую терминологию «линейная» / «без коррекции», которая не была согласованной у разных производителей.
В сомнении — A-коррекция. При басистом источнике дополнительно сообщайте C; разрыв A и C сам по себе диагностичен по спектральному содержанию.
Кривые равной громкости
Частотная зависимость слуха не одна кривая — она меняется с уровнем. На низких SPL Вы очень нечувствительны к низким частотам; на высоких SPL кривая выпрямляется.
Классические экспериментальные данные — Флетчер и Мансон, 1933, с современными ревизиями, стандартизованными как ISO 226:2003. Оба дают семейство кривых, каждая помечена значением фон: фон — это SPL тона на 1 kHz, воспринимаемого равно громко с тестовым тоном. Кривая 40 фон показывает SPL, нужный на каждой частоте, чтобы звучать так же громко, как 40 dB SPL на 1 kHz.
Несколько практических следствий:
- A-коррекция моделирует кривую 40 фон, поэтому она наиболее точна на умеренных уровнях (40 – 60 dB SPL). На высоких уровнях (> 90 dB SPL) A-коррекция недооценивает низкие частоты по сравнению с реальным откликом уха.
- Фон — единица уровня громкости, не самой громкости.
- Сон — единица воспринимаемой громкости, определена так, что удвоение сонов соответствует удвоению воспринимаемой громкости. 1 сон = 40 фон. 2 сона = 50 фон (правило +10 фон = ×2 громкости).
Временная интеграция
Микрофон выдаёт мгновенное значение давления много тысяч раз в секунду. Сообщать любой отдельный сэмпл как «уровень» — бесполезно; вместо этого шумомеры считают временно-взвешенное RMS на выбранном времени интеграции:
p_rms(t) = sqrt( (1/τ) × integral( p²(s) × e^(-(t-s)/τ) ) ds )
Постоянная времени τ задаёт скорость отклика:
- Fast (F) —
τ = 125 ms. По умолчанию для средовых и профессиональных измерений. - Slow (S) —
τ = 1000 ms. Для стабильного фона. - Impulse (I) —
τ_attack = 35 ms,τ_decay = 1500 ms. Ловит короткие транзиенты (выстрелы, удары молотка).
Для шума, заметно меняющегося во времени, временно-взвешенный SPL мерцает. Большинство нормативных стандартов используют вместо этого эквивалентный непрерывный уровень (Leq или LAeq для A-коррекции) — стабильный SPL, выдающий ту же общую акустическую энергию, что и реальный переменный сигнал:
LAeq,T = 10 × log10( (1/T) × integral( 10^(LA(t)/10) ) dt )
Leq — эквивалент по энергии, аддитивен по времени, основа любой современной нормы профессионального шума. Другие статистические дескрипторы иногда используют для шума сообщества:
- L10, L50, L90 — уровень, превышенный 10 %, 50 %, 90 % периода измерения. L10 — «типичный пик»; L90 — «фон».
- Lden — взвешенное среднее день-вечер-ночь, используется в картировании шума ЕС. Штрафует вечерний +5 dB, ночной +10 dB.
- Lmax, Lpeak — максимумы по событию. Lmax — временно-взвешенный; Lpeak — мгновенный пик без коррекции.
FFT и спектральный анализ
Волну давления во временной области можно преобразовать в частотную через быстрое преобразование Фурье (FFT). FFT берёт окно сэмплов и выдаёт комплексный спектр с амплитудой и фазой каждого частотного бина внутри окна.
Несколько свойств FFT, которые должен знать каждый:
- Разрешение бина = sample_rate / FFT_size. При частоте 48 kHz и FFT 2048 точек — 23,4 Hz на бин, тонко для музыки и речи, грубо для низкочастотного анализа, где может понадобиться 1-Hz разрешение.
- Оконная функция — умножение временных сэмплов на окно (Хэнн, Хэмминг, Блэкмен, Кайзер) перед FFT уменьшает спектральную утечку ценой более широких главных лепестков. Наш визуализатор использует окно Хэнна.
- Время-частотная неопределённость. Большие окна FFT дают тоньше частотное разрешение, грубее временное. Иметь оба нельзя — Гейзенберг применительно к акустике.
Для средовых и профессиональных измерений анализ в третьоктавных полосах полезнее узкополосного FFT. Анализатор третьоктав группирует бины в перцептивно осмысленные полосы (которые ухо примерно различает), что делает спектр читаемым и сравнимым со стандартными кривыми оценки шума (NC, RC, NR).
Визуализатор в нашем шумомере показывает узкополосный FFT для диагностических целей — тональные источники выскакивают одиночными пиками. Для формального частотного анализа — SLM Класса 2 со встроенными третьоктавными полосами.
Возвращаемся к шумомеру
Каждое число на шумомере — результат:
- Семплирования давления воздуха на микрофоне (страница калибровки описывает, что может пойти не так здесь).
- A-коррекции цифрового сигнала (или C, или Z, по настройкам).
- Возведения в квадрат, временной коррекции (Fast / Slow / Impulse) и извлечения корня для получения RMS-давления.
- Взятия 20 × log10 отношения к 20 µPa.
- Прибавления пользовательского сдвига калибровки.
Знание цепочки не меняет показания, но объясняет, почему два прибора могут расходиться: разные калибровки микрофона, разные коррекции, разные времена интеграции, разные опорные значения. Когда числа не сходятся, ответ почти всегда где-то в этой цепочке.
Для практической интерпретации — что считается громким, что безопасно, какие правила применимы — см. таблицу сравнения, страницу слухового здоровья и страницу рабочих норм. Определения терминов — в глоссарии, который служит индексом обратно на эту страницу.