By the Sound Decibel Meter Team

소리의 과학: 데시벨, 주파수, 청각의 물리

소음계 의 모든 측정값은, 물리·신호 처리·심리음향학이 줄지어 늘어선 사슬의 마지막 끝, 눈에 보이는 출구에 있습니다. 이 사슬을 이해해 두면, 측정값이 한층 더 쓸모 있어집니다. "90 dB 이 시끄러운가?" 라는 물음에서, "무엇을 기준으로 한 90 dB? 어떤 가중으로? 얼마만큼의 시간 적분으로?" 라는, 정말로 의미 있는 물음으로 옮겨 갈 수 있기 때문입니다. 이 페이지에서는 음파의 물리, 데시벨 척도의 수학, 4 종의 표준 주파수 가중, 등감도 곡선, 시간 적분, FFT 스펙트럼 분석을 차례로 풀어 보겠습니다. 끝까지 읽고 나면, 공개된 임의의 소음 수치를 보고, 그것이 무엇을 의미하고, 무엇을 의미하지 않는지를 정확히 판단할 수 있게 될 것입니다.

본 사이트에서 가장 기술적인 페이지입니다. 학습 목적이라면 처음부터 차근히 읽어 주세요. 특정 개념을 찾고 싶을 뿐이라면, 용어집 에서 해당 절로의 상호 링크를 걸어 두었습니다.

소리는 압력파다

소리는 탄성 매질 — 보통은 공기 — 을 전파하는 압력 변동의 종파입니다. 진동하는 음원은 자기 앞쪽에서 공기를 압축하고, 후퇴할 때 팽창시킵니다. 이 압축과 팽창의 패턴이 음속으로 바깥쪽으로 퍼져 갑니다. 공기 중에서 약 343 m/s (20 °C), 찬 공기에서는 느리게, 따뜻한 공기나 물 같은 밀도 높은 매질에서는 더 빠릅니다.

마이크가 응답하는 물리량은 압력 — 순간의 국소적인 공기압과, 정상의 대기압과의 차입니다. 대기압은 약 101,325 Pa (101 kPa), 건강한 젊은 청자의 귀가 검출할 수 있는 가장 작은 소리 — 1 kHz 에서의 청각역치 는, 약 20 마이크로파스칼(20 µPa), 즉 20 × 10⁻⁶ Pa 의 압력 변동입니다. 통각역치는 대략 20 Pa, 청각역치의 100 만 배 위치에 있습니다.

이 "압력에서 100 만 배" 라는 범위가, 데시벨이라는 로그 척도를 낳은 동기입니다. 리니어한 파스칼로 이 폭을 다루면 손에 쥘 수 없는 수가 늘어섭니다(0.00002 와 20 의 비교). 로그로 압축하면 0 dB 에서 120 dB 안에 들어가, 적는 것도 따지는 것도 훨씬 쉬워집니다.

압력파에는 세 가지 주요 기술자가 있습니다.

진폭(amplitude) — 압력 변동의 크기. 라우드니스에 대응하지만, 강한 비선형성을 동반(후술의 등감도 곡선 참조).
주파수(frequency) — 1 초당 압축‑팽창 사이클 수, 헤르츠(Hz) 로 측정. 음높이에 대응하지만, 이것도 비선형.
위상(phase) — 사이클 어디에 지금 있는지. 레벨 측정에는 거의 무관, 간섭 측정과 다중 마이크 배치에서는 중요.

순수한 사인파라면, 이 셋으로 신호를 완전히 기술할 수 있습니다. 실제 소리는 거의 예외 없이 순음이 아닙니다. 다수의 주파수 성분의 합이고, 각 성분은 각각의 진폭과 위상을 갖고, 시간과 함께 연속적으로 변화해 갑니다.

데시벨 척도

데시벨은 단위가 아닙니다. 고정된 분모를 기준으로 쓸 수 있도록 수치화된, 두 양의 로그 비입니다. 음압 레벨(SPL) 에서는, 표준 기준으로 20 µPa 가 쓰입니다. 측정 압력 p 에 대해, 데시벨 단위의 SPL 은 다음 식으로 구해집니다.

L_p = 20 × log10( p / p_0 )       여기서 p_0 = 20 µPa

10 이 아니라 20 이 곱해지는 이유는, 압력이 음향 강도의 제곱근에 비례하기 때문이고, 데시벨은 본래 파워 비 이기 때문입니다. 음향 강도에서는:

L_I = 10 × log10( I / I_0 )       여기서 I_0 = 1 pW/m²

자유음장에서는 어느 식이든 같은 값을 반환하므로, 다수의 장면에서 호환적으로 다루어집니다. "dB" 라고만 말하고, 어느 정의인지 명시하지 않아도 통해 버리는 이유는 여기에 있습니다.

수식에서 직접 도출되는 경험칙이 셋.

+3 dB 면 음향 에너지가 2 배. 동일·무상관의 두 음원(각 60 dB) 을 합성하면 63 dB, 66 dB 가 아닙니다. 동일 음원 셋이라면 60 + 10 log10(3) ≈ 64.8 dB.
+10 dB 는 인간의 청감으로 대체로 "2 배 시끄럽다". 강도에서는 10 배 증가가, 청각의 비선형성에 의해 청감으로는 약 2 배로 압축됩니다.
+6 dB 는 압력이 2 배, 강도는 4 배. 이것이 거리 이야기로 이어집니다. 자유음장의 점음원에서는 거리가 두 배가 되면 SPL 이 6 dB 떨어집니다.

dB 척도에는, 초학자를 혼란시키기 쉬운 파생이 몇 가지 있습니다.

dB SPL — 위에서 말한 압력 척도. 음향 측정의 표준.
dB FS (decibel full scale) — 디지털 음성에서 쓴다. 0 dB FS 가 표현 가능한 최대 디지털 샘플값, 그 외는 모두 음수. 기준 교정 없이는 dB SPL 과 직접 비교할 수 없다.
dB SWL (음향 파워 레벨, sound power level) — 음원이 방사하는 절대 파워. 측정 위치에 의존하지 않음. 기기의 정격값 등에 쓰임.
dBA / dBC / dBZ — dB SPL 측정에 A, C, Z 가중을 건 것. 수치 옆에는 반드시 가중을 함께 기재할 것.

주파수와 음높이

인간의 귀는, 저역의 약 20 Hz 부터 고역의 약 20 kHz 까지의 압력 변동에 응답합니다. 상한은 가령(노화) 과 함께 꾸준히 떨어져, 일반적인 60 세 청자는 약 12 kHz 까지밖에 들리지 않습니다. 20 Hz 미만의 것은 저주파음(infrasound) — 들린다기보다 몸으로 느끼는 영역 — 이고, 20 kHz 를 넘는 것은 초음파(ultrasound) (개 호루라기는 약 25 kHz, 의료용 초음파는 메가헤르츠 대) 입니다.

주파수 간격의 표기에는 두 척도가 자주 쓰입니다.

옥타브 — 주파수의 두 배. 100 Hz 에서 200 Hz 가 1 옥타브, 200 Hz 에서 400 Hz 가 다음 1 옥타브. 가청역은 약 10 옥타브분.
1/3 옥타브 — 1 옥타브를 3 대역으로 분할. 귀의 주파수 분해능에 대체로 가까워, 음향 측정에서 전통적으로 채택. 표준 중심 주파수는 ISO 266 이 규정(…100, 125, 160, 200, 250, 315, 400…).

실제 소리에는 광대역(broadband) 한 내용이 포함됩니다. 진공청소기는 다수의 주파수대에 에너지가 넓게 분산되어 있는 한편, 소리굽쇠는 단일 주파수에 집중되어 있다. 환경 소음의 대부분은 광대역, 악음의 대부분은 의사 순음(기본파 + 배음) 입니다.

주파수 가중

인간의 귀는, 모든 주파수에 대해 같은 감도를 갖고 있는 게 아닙니다. 그뿐 아니라 감도의 차이는 꽤 큽니다. 1 kHz 의 60 dB 음은, 50 Hz 의 60 dB 음보다 분명히 시끄럽게 들립니다. 귀가 중역에 대해 가장 민감하고, 저역, 그리고 약 5 kHz 보다 위에서는 약간 감도가 떨어지기 때문입니다.

측정용 마이크는 설계상 평탄 합니다 — 가청역 전체에 걸쳐, 출력 전압이 음향 압력에 비례합니다. 평탄함은 옳은 출발점이지만, 생 측정값은 인간 청자가 느끼는 라우드니스를 반영하지 않습니다. 이 괴리를 메우기 위해, 소음계는 레벨을 계산하기 전에 주파수 가중 필터 를 겁니다.

IEC 61672‑1 에서 표준화되어 있는 가중은 4 가지, 역사적 경위에서 알파벳으로 명명되어 있습니다.

A 가중

40 phon 의 등감도 곡선의 역곡선을 근사합니다. 500 Hz 보다 아래를 강하게 감쇠시키고(50 Hz 에서 약 −30 dB, 20 Hz 에서 약 −40 dB), 6 kHz 보다 위도 약간 감쇠, 1 ~ 5 kHz 의 가장 민감한 대역은 거의 평탄. 직업성·환경 소음의 거의 모든(NIOSH, OSHA, WHO, ISO 1996, EU 2003/10) 에서 채택되어 있습니다.

수학적으로는 4 극 4 영점의 아날로그 필터로 표현됩니다.

R_A(f) = (12194² × f⁴) / [ (f² + 20.6²) × √((f² + 107.7²)(f² + 737.9²)) × (f² + 12194²) ]
A(f) = 20 × log10( R_A(f) ) + 2.00 dB

말미의 +2.00 dB 는, A 가중을 1 kHz 에서 0 dB 로 정규화하기 위한 오프셋입니다.

C 가중

A 보다 훨씬 평탄. 가청역의 양 끝만 감쇠시킵니다(31.5 Hz 와 8 kHz 에서 대략 −3 dB, 50 Hz 에서는 약 −0.2 dB). 피크 측정 (지각적 라우드니스보다 실제의 피크 에너지가 문제 되는 장면), 콘서트·서브우퍼·천둥 등의 저주파 지배 음원, 그리고 고 SPL 영역 — 귀의 주파수 응답이, A 가중이 근사하는 40 phon 이 아니라 40 ~ 100 phon 의 곡선에 가까워집니다 — 의 측정에 전통적으로 쓰여 왔습니다.

B 가중, D 가중

B 가중은 중간 정도의 레벨(50 ~ 60 phon) 을 상정한 중간 특성, D 가중은 항공기 소음에 특화된 것. 어느 쪽이든 현대의 규격에서는 비추천화되었고, 실무에서 마주칠 일은 드뭅니다.

Z 가중

영(zero) 가중 — 10 Hz 부터 20 kHz 까지 평탄한 응답. 연구와 계측기 검증에 씁니다. 메이커 간에 정의가 통일되어 있지 않던 "리니어", "무가중" 이라는 옛 호칭을 대체한 것입니다.

망설여지면 A. 저음 지배 음원을 측정한다면 A 와 C 양쪽을 함께 기재 하세요. A 와 C 의 차이 자체가, 음원의 스펙트럼 내용을 진단하는 양 이 됩니다.

등감도 곡선

인간의 청각의 주파수 의존성은, 단일 곡선으로는 표현할 수 없습니다. SPL 의 레벨에 따라 변화합니다. 낮은 SPL 에서는 저주파에 대해 매우 둔감, 높은 SPL 에서는 이 곡선이 평탄에 가까워져 갑니다.

고전적인 실험 데이터는 Fletcher and Munson 1933, 근대적인 개정판은 ISO 226:2003 으로 표준화되어 있습니다. 어느 쪽이든 한 무리의 곡선을 만들고, 각각이 phon(폰) 의 값으로 라벨이 붙습니다. phon 은, 테스트 음과 같은 라우드니스로 들리는 1 kHz 음의 SPL 값. 예를 들어 40 phon 곡선은, "1 kHz·40 dB SPL 의 음과 같은 라우드니스로 들리려면, 각 주파수에서 몇 dB SPL 가 필요한지" 를 보여 줍니다.

실용적인 함의를 몇 가지.

A 가중은 40 phon 곡선을 모델화한 것이라, 중간 정도의 음량(40 ~ 60 dB SPL) 에 대해 가장 정밀도가 높다. 고음량(> 90 dB SPL) 에서는 귀의 실제 응답에 대해 저주파를 과소 평가한다.
phon 은 라우드니스 레벨의 단위로, 라우드니스 그 자체의 단위가 아니다.
sone(손) 이 지각 라우드니스 그 자체의 단위. 손이 두 배가 되면, 지각되는 라우드니스가 두 배가 되도록 정의되어 있습니다. 1 sone = 40 phon, 2 sones = 50 phon ("+10 phon ≒ 2 배 시끄럽다" 의 경험칙이 여기서 나옵니다).

시간 적분

마이크는 1 초간에 수천 회나 순간 압력값을 출력합니다. 단일 샘플을 "레벨" 로 보고해도 무의미하니, 소음계는 고른 적분 시간에 걸친 시간가중 RMS 를 계산합니다.

p_rms(t) = sqrt( (1/τ) × integral( p²(s) × e^(-(t-s)/τ) ) ds )

시정수 τ 가 응답 속도를 정합니다.

Fast (F) — τ = 125 ms. 환경·직업성 측정의 디폴트.
Slow (S) — τ = 1000 ms. 안정된 주위 소음용.
Impulse (I) — τ_attack = 35 ms, τ_decay = 1500 ms. 짧은 순간음(총성, 망치질) 을 잡는다.

시간과 함께 크게 변동하는 소음에서는, 시간가중 SPL 이 깜빡입니다. 다수의 규제는 대신에 등가연속 레벨 (Leq, A 가중이라면 LAeq) — 실제의 변동 신호와 같은 총 음향 에너지를 운반하는 정상 SPL — 을 씁니다.

LAeq,T = 10 × log10( (1/T) × integral( 10^(LA(t)/10) ) dt )

Leq 는 에너지 등가로, 시간 방향으로 가산 가능. 현대의 모든 직업성 소음 규격의 토대가 되어 있는 양입니다. 지역 소음에는 다른 통계량도 쓰입니다.

L10, L50, L90 — 측정 기간의 10 %, 50 %, 90 % 로 초과하고 있던 레벨. L10 은 "전형적인 피크" 레벨, L90 은 "배경" 레벨.
Lden — EU 의 지역 소음 매핑에서 쓰는, 주·저녁·야간의 가중 평균. 저녁은 +5 dB, 야간은 +10 dB 의 페널티를 부여한다.
Lmax, Lpeak — 단일 이벤트의 최대값과 피크 압력 레벨. Lmax 는 시간가중, Lpeak 는 무가중의 순간 피크.

FFT 와 스펙트럼 분석

시간 영역의 압력 파형은, 고속 푸리에 변환(FFT) 에 의해 주파수 영역으로 변환할 수 있습니다. FFT 는 음성 샘플의 창을 잡아, 그 창 내의 각 주파수 빈의 진폭과 위상을 가지는 복소 스펙트럼을 반환합니다.

사용자가 잡아 두어야 할 성질을 셋.

빈 분해능 = 샘플레이트 / FFT 사이즈. 48 kHz 샘플링, 2048 점 FFT 라면 1 빈당 23.4 Hz. 음악이나 음성에는 충분, 저주파 분석에서 1 Hz 분해능이 필요한 장면에서는 너무 거칠다.
창 함수. FFT 를 걸기 전에 샘플에 창 함수(Hann, Hamming, Blackman, Kaiser 등) 를 걸면, 메인 로브가 넓어지는 대신 스펙트럼 누설이 억제된다. 본 사이트의 비주얼라이저는 Hann 창을 사용.
시간 × 주파수의 불확정성. FFT 창을 크게 하면 주파수 분해능은 곱게, 시간 분해능은 거칠어진다. 양립시킬 방법은 없다. 음향에 적용된 Heisenberg 원리.

환경·직업성 측정에서는, 협대역 FFT 보다 1/3 옥타브 분석 쪽이 유용합니다. 1/3 옥타브 분석기는 FFT 빈을 "귀가 대체로 분해할 수 있는" 대역으로 묶어 주므로, 결과의 스펙트럼이 읽기 쉽고, 표준적인 소음 평가 곡선(NC, RC, NR) 과 직접 비교할 수 있습니다.

본 사이트의 계측기 의 비주얼라이저는 진단 목적의 협대역 FFT 를 표시합니다. 토널 음원은 단일 피크로 분명히 떠올라 옵니다. 정식 주파수 분석이 필요한 장면에서는, 1/3 옥타브 밴드 기능을 내장한 Class 2 소음계 를 쓰세요.

계측기로 돌아온다

소음계 의 모든 수치는, 다음 사슬의 결과입니다.

마이크에서 공기압을 샘플링(여기서 무엇이 망가질 수 있는지는 교정 페이지).
디지털 신호에 A 가중(또는 설정에 따라 C, Z) 을 적용.
제곱, 시간 가중(Fast / Slow / Impulse), 제곱근 — RMS 압력을 생성.
20 µPa 와의 비에 대해 20 × log10 을 잡는다.
사용자 교정 오프셋을 가산.

이 사슬을 알아도, 눈앞의 수치는 변하지 않습니다. 그렇다 해도, 다른 두 대의 계측기가 왜 다른 값을 내는지 는 알게 됩니다. 마이크의 교정이 다르다, 가중이 다르다, 적분 시간이 다르다, 기준값이 다르다 — 수치가 맞지 않을 때, 답은 거의 반드시 이 사슬의 어딘가에 있습니다.

수치의 실용적 해석 — 어디까지 시끄러운가, 무엇이 안전한가, 어느 규제가 적용되는가 — 에 대해서는, 비교표, 청력 건강 페이지, 직장 소음 규제 페이지 를 참조하세요. 용어의 정의는 용어집 에 정리되어 있습니다.

Open the decibel meter