Sound Decibel Meter 团队

声学原理:分贝、频率和听觉是怎么连起来的

分贝仪上的每一个数字,都是一连串物理、信号处理、心理声学链路的可视末端。理解这条链能让数字真正有用 — 你不会再问"90 dB 算响吗",而是开始问那些有意义的问题:90 dB 是相对什么参考、经过什么加权滤波、积分了多长时间。本页从声波物理出发,经过分贝刻度的数学、四种标准频率加权、等响曲线、时间积分,一直讲到 FFT 频谱分析。读完之后,你应当能拿任何公开发布的噪音数字,精确知道它意味着什么、不意味着什么。

这是本站最长的一篇技术页。想系统学,从头读到尾。想查具体概念,本站术语表里每个词条都交叉链接到本页对应的位置。

声音是压力波

声音是在弹性介质(通常是空气)中传播的纵向压力波。振动的声源把它前面的空气压缩,回退时使其稀疏,这种"压缩 - 稀疏"图样以声速向外传播 — 在 20 °C 的空气里大约 343 m/s,冷空气里更慢,温暖或更密的介质(水)里更快。

麦克风响应的物理量是压力 — 瞬时局部气压相对于稳定大气压的差。大气压约 101,325 Pa(101 kPa);健康年轻人耳朵在 1 kHz 频率上能侦测到的最小声音 — 听觉阈值 — 对应约 20 微帕(20 µPa),即 20 × 10⁻⁶ Pa。痛感阈值大约在 20 Pa,高出一百万倍。

这一百万倍的压力比正是分贝刻度的对数动机。在线性帕斯卡刻度下,这个范围里的数字几乎没法用(0.00002 vs 20)。对数压缩之后,从 0 dB 到 120 dB,写起来、想起来都简单得多。

一个压力波有三个关键描述量:

幅度 — 压力变化的大小。映射到响度,但是高度非线性的(见下面的等响曲线)。
频率 — 每秒压缩‑稀疏的循环次数,单位赫兹(Hz)。映射到音高,同样非线性。
相位 — 当前在循环里走到哪儿。在等级测量中基本不重要,但对干涉和多麦克风设置很关键。

对纯正弦音,这三个数字完整描述信号。真实声音几乎从不是纯音 — 它们是许多频率成分的和,各有自己的幅度和相位,并随时间连续变化。

分贝刻度

分贝不是单位,而是两个量之间的对数比 — 通过参考分母把它变成可用数字。声压级(SPL)的标准参考是 20 µPa。给定测得的压力 p,SPL 用分贝表示为:

L_p = 20 × log10( p / p_0 )       其中 p_0 = 20 µPa

系数是 20 而不是 10,因为压力与强度的平方根成正比,而分贝是功率比。声强级:

L_I = 10 × log10( I / I_0 )       其中 I_0 = 1 pW/m²

在自由场中,两个公式给出同样的数字 — 这就是为什么大多数人把它们互换使用,以及为什么"dB"在不指明哪个公式的情况下也通常可解释。

三个直接落在数学上的经验法则:

+3 dB 声能翻倍。 两个一样的非相干声源(各 60 dB)叠加是 63 dB,不是 66 dB。三个一样的声源叠加是 60 + 10 log10(3) ≈ 64.8 dB。
+10 dB 听感大约翻倍。 10 倍声强增量被人耳的非线性压缩成大约 2 倍听感增量。
+6 dB 压力翻倍 但声强翻 4 倍。这一点对距离很关键:自由场点声源距离翻倍,SPL 下降 6 dB。

分贝刻度还有几个新手常困惑的变体:

dB SPL — 上面那条压力刻度。声学测量的默认值。
dB FS(满刻度)— 数字音频用。0 dB FS 是最大可表示的采样值;其它都是负数。没有参考校准时不能直接和 dB SPL 比较。
dB SWL(声功率级)— 声源辐射的绝对功率,与测量位置无关,用在设备规格里。
dBA / dBC / dBZ — 在 dB SPL 测量上应用了 A、C 或 Z 加权。报告数字时永远要标加权方式。

频率与音高

人耳响应大约 20 Hz 到 20 kHz 的压力变化,上限随年龄稳步下降(典型 60 岁能听到约 12 kHz)。20 Hz 以下叫次声(更多是感觉而非听见);20 kHz 以上叫超声(狗笛大约 25 kHz;医用超声在兆赫量级)。

测量频率间距用两个刻度:

倍频程 — 频率翻倍。100 Hz 到 200 Hz 是一倍频程;200 Hz 到 400 Hz 是下一倍频程。可听范围大约 10 个倍频程。
1/3 倍频程 — 每倍频程三段,声学测量里的传统选择,因为它大致匹配人耳的频率分辨率。ISO 266 规定了标准中心频率(...100、125、160、200、250、315、400...)。

真实声音几乎都是宽带的:吸尘器是分布在很多频段上的能量;音叉则集中在单一频率。多数环境噪音是宽带的;多数音乐音是准纯音(基频加谐波)。

频率加权

人耳对所有频率不是一视同仁 — 远不止一视同仁。一个 60 dB 的 1 kHz 纯音,听起来比一个 60 dB 的 50 Hz 纯音明显更响,因为耳朵对中频更敏感、对低频和大约 5 kHz 以上不那么敏感。

测量麦克风按设计是平的 — 它的电输出在可听范围内与声压成正比。这种平响是合适的起点,但意味着原始测量并不反映人类听者的真实体验。为了弥合这个差距,声级计在算等级前会施加 频率加权滤波器。

IEC 61672‑1 标准化了四种加权,按字母历史命名:

A 加权

近似 40 phon 等响曲线的倒数。在 500 Hz 以下大幅衰减(50 Hz 处约 −30 dB,20 Hz 处约 −40 dB),6 kHz 以上轻微衰减;在 1 – 5 kHz 这段最敏感的范围里近乎平坦。几乎所有职业与环境噪音(NIOSH、OSHA、WHO、ISO 1996、欧盟 2003/10)都用 A。

数学形式是 4 极 4 零的模拟滤波器:

R_A(f) = (12194² × f⁴) / [ (f² + 20.6²) × √((f² + 107.7²)(f² + 737.9²)) × (f² + 12194²) ]
A(f) = 20 × log10( R_A(f) ) + 2.00 dB

+2.00 dB 偏移把 A 加权在 1 kHz 处归一到 0 dB。

C 加权

比 A 平得多。只在可听范围两端有衰减(31.5 Hz 和 8 kHz 处约 −3 dB,50 Hz 处约 −0.2 dB)。用于峰值测量(此时实际峰值能量比它的感知响度更重要)、低频声源(演唱会、低音炮、雷击),以及历史上对高电平声音(此时耳朵的频率响应接近 40 – 100 phon 而不是 40 phon)的测量。

B 与 D 加权

B 是中等等级加权,目标是中等声压(50 – 60 phon)。D 专用于飞机噪音。两者都被现代标准弃用,实务上很少遇到。

Z 加权

零加权 — 10 Hz 到 20 kHz 平响应。研究和仪器核验用。它取代了较早的"线性"或"未加权"叫法,后者各厂家定义不一致。

有疑虑就用 A。测量低频主导的东西时,把 C 也报上;A 与 C 的差本身就是频谱内容的诊断。

等响曲线

人耳的频率依赖性不是单一曲线 — 它随等级变化。低 SPL 时你对低频很不敏感;高 SPL 时曲线变平。

经典实验数据是 Fletcher 和 Munson 1933,现代版本被标准化为 ISO 226:2003。两套都给出一族曲线,每条用一个 phon 值标记 — phon 是被感知与某个 1 kHz 纯音同响时,该 1 kHz 纯音的 SPL。所以"40 phon"曲线显示的是各频率上要达到与 1 kHz、40 dB SPL 同响所需的 SPL。

实务含义:

A 加权建模的是 40 phon 曲线,所以它在中等响度(40 – 60 dB SPL)下最准。在高响度(> 90 dB SPL)下,A 加权相对于耳朵的实际响应低估了低频。
phon 是响度级的单位,不是响度本身。
sone 是感知响度的单位,定义使 sone 翻倍对应感知响度翻倍。1 sone = 40 phon;2 sone = 50 phon(+10 phon = 听感翻倍这条规则)。

时间积分

麦克风每秒报告几千次瞬时压力值。把任意单一采样当作"等级"是没用的 — 取而代之的是,声级计在选定积分时间内计算 时间加权 RMS:

p_rms(t) = sqrt( (1/τ) × integral( p²(s) × e^(-(t-s)/τ) ) ds )

时间常数 τ 决定响应速度:

Fast (F) — τ = 125 ms。环境与职业测量的默认。
Slow (S) — τ = 1000 ms。稳态环境噪音用。
Impulse (I) — τ_attack = 35 ms,τ_decay = 1500 ms。捕捉短暂瞬态(枪声、敲击)。

对随时间变化大的噪音,时间加权 SPL 会跳。多数监管标准用 等效连续等级(Leq 或 A 加权的 LAeq)— 它是稳态 SPL,在测量周期里输送的总声能等同于实际可变信号:

LAeq,T = 10 × log10( (1/T) × integral( 10^(LA(t)/10) ) dt )

Leq 是能量等效、可在时间上相加,是每个现代职业噪音标准的基础。其它统计描述符在社区噪音里也常见:

L10、L50、L90 — 测量周期内被超过 10 %、50 %、90 % 时间的等级。L10 是"典型峰值"等级;L90 是"背景"等级。
Lden — 欧盟社区噪音地图用的昼‑暮‑夜加权均值。傍晚加 +5 dB 罚,夜间加 +10 dB 罚。
Lmax、Lpeak — 单事件最大值与峰值压力级。Lmax 是时间加权的;Lpeak 是瞬时未加权峰值。

FFT 与频谱分析

时域压力波形可以用 快速傅里叶变换(FFT) 转到频域。FFT 取一个音频采样窗口,产生一份复频谱,显示窗口内每个频段的幅度和相位。

每个用户都该知道的几个 FFT 性质:

频段分辨率 = 采样率 / FFT 大小。 48 kHz 采样率配 2048 点 FFT 给出每段 23.4 Hz — 对音乐和语音是细的,对低频分析(可能要 1 Hz 分辨率)是粗的。
窗口函数 — FFT 之前用窗(Hann、Hamming、Blackman、Kaiser)乘时域采样能减少频谱泄漏,代价是主瓣变宽。本站可视化器用 Hann 窗。
时频不确定性。 大 FFT 窗给出更细的频率分辨率但更粗的时间分辨率。无法两者兼得 — 海森堡不确定性,声学版本。

对环境与职业测量,1/3 倍频程分析比窄带 FFT 更有用。1/3 倍频程分析仪把 FFT 频段聚合成感知有意义的带(即耳朵大致能分辨的那些),让结果频谱可读、可与标准噪音评价曲线(NC、RC、NR)比较。

本站分贝仪中的可视化器显示窄带 FFT,用于诊断 — 纯音声源会作为单一峰跳出来。要做正式频率分析,用带内置 1/3 倍频程的 Class 2 SLM。

串回到仪器

分贝仪上的每一个数字,都是这条链的产物:

在麦克风处采样气压(这一步可能出什么问题,见校准页)。
数字信号施加 A(或 C 或 Z)加权。
平方、时间加权(Fast / Slow / Impulse)、开方,得出 RMS 压力。
取与 20 µPa 比的 20 × log10。
加上用户校准偏移。

了解这条链不会改变读数,但它告诉你两台仪器为什么会不一致:不同的麦克风校准、不同的加权、不同的积分时间、不同的参考值。当数字对不上,答案几乎总在这条链里。

实务解读 — 什么算响、什么算安全、哪些法规适用 — 见对照表、听力健康页和工作场所标准页。术语索引回到本页的具体位置,见术语表。

打开分贝仪