Sains suara: penjelasan desibel, frekuensi, dan pendengaran
Setiap pembacaan pada pengukur desibel adalah ujung yang terlihat dari rangkaian fisika, pemrosesan sinyal, dan psikoakustik. Memahami rangkaian itu membuat pembacaan berguna — Anda berhenti bertanya "apakah 90 dB keras?" dan mulai mengajukan pertanyaan yang lebih berguna: 90 dB dibandingkan referensi apa, melalui filter pembobotan apa, diintegrasikan selama jendela waktu apa. Halaman ini bekerja melalui fisika gelombang suara, matematika skala desibel, empat pembobotan frekuensi standar, kontur kerasnya sama, integrasi waktu, dan analisis spektrum FFT. Di akhir Anda harus dapat membaca angka kebisingan yang dipublikasikan apa pun dan tahu persis apa yang dimaksudkan dan tidak.
Ini halaman teknis terpanjang di situs. Jika Anda di sini untuk belajar, baca dari atas ke bawah. Jika Anda di sini untuk mencari konsep tertentu, glosarium menghubungkan silang ke bagian relevan halaman ini untuk setiap istilah.
Suara adalah gelombang tekanan
Suara adalah gelombang longitudinal variasi tekanan yang merambat melalui media elastis — biasanya udara. Sumber bergetar memampatkan udara di depannya, lalu meregangkan saat bergerak kembali, dan pola pemampatan-peregangan itu bergerak keluar pada kecepatan suara (kira-kira 343 m/s di udara pada 20 °C, lebih lambat di udara dingin, lebih cepat di hangat atau di media lebih padat seperti air).
Kuantitas fisik yang direspons mikrofon adalah tekanan — selisih antara tekanan udara lokal sesaat dan tekanan atmosfer stabil. Tekanan atmosfer sekitar 101.325 Pa (101 kPa); suara terkecil yang dapat dideteksi telinga muda sehat — ambang dengar pada 1 kHz — adalah variasi tekanan sekitar 20 mikropaskal (20 µPa), atau 20 × 10⁻⁶ Pa. Ambang nyeri sekitar 20 Pa, sejuta kali lebih tinggi.
Rasio sejuta dalam tekanan itu yang memotivasi skala desibel logaritmik. Bekerja dengan paskal linear di rentang itu menghasilkan angka yang merepotkan (bandingkan 0,00002 dengan 20). Memampatkan rentang secara logaritmik menghasilkan 0 dB hingga 120 dB, jauh lebih mudah ditulis dan dipikirkan.
Gelombang tekanan punya tiga deskriptor kunci:
- Amplitudo — magnitudo variasi tekanan. Memetakan ke kerasnya, dengan nonlinearitas kuat (lihat kerasnya sama di bawah).
- Frekuensi — jumlah siklus pemampatan-peregangan per detik, dalam hertz (Hz). Memetakan ke pitch, lagi-lagi dengan nonlinearitas.
- Fase — di mana dalam siklus gelombang saat ini. Sebagian besar tak relevan untuk pengukuran level, penting untuk interferensi dan pengaturan multi-mikrofon.
Untuk nada sinus murni, tiga angka itu sepenuhnya menggambarkan sinyal. Suara nyata hampir tidak pernah nada murni — itu adalah jumlah banyak komponen pada frekuensi berbeda, masing-masing dengan amplitudo dan fase sendiri, bervariasi terus menerus dari waktu ke waktu.
Skala desibel
Desibel bukan unit — itu adalah rasio logaritmik antara dua kuantitas, dijadikan angka berguna dengan referensi ke penyebut tetap. Untuk tingkat tekanan suara (SPL), referensi standar adalah 20 µPa. Diberi tekanan terukur p, SPL dalam desibel adalah:
L_p = 20 × log10( p / p_0 ) di mana p_0 = 20 µPa
Faktor 20 (bukan 10) karena tekanan proporsional ke akar kuadrat intensitas, dan desibel adalah rasio daya. Untuk intensitas akustik:
L_I = 10 × log10( I / I_0 ) di mana I_0 = 1 pW/m²
Di medan bebas, kedua rumus menghasilkan angka sama, itulah sebabnya kebanyakan orang menggunakannya secara bergantian dan mengapa "dB" adalah jawaban yang berarti tanpa menentukan yang mana.
Tiga aturan praktis langsung jatuh dari matematika:
- +3 dB melipatgandakan energi akustik. Dua sumber inkoheren identik (masing-masing 60 dB) berjumlah ke 63 dB, bukan 66 dB. Tiga sumber identik berjumlah 60 + 10 log10(3) ≈ 64,8 dB.
- +10 dB kira-kira ×2 lebih keras ke pendengar manusia. Peningkatan intensitas 10× dimampatkan ke kira-kira ×2 keras yang dirasakan oleh nonlinearitas pendengaran manusia.
- +6 dB melipatgandakan tekanan tetapi hanya menambah 4× intensitas. Ini penting untuk jarak: sumber titik di medan bebas menggandakan jaraknya dan SPL turun 6 dB.
Skala desibel juga punya varian yang membingungkan pendatang baru:
- dB SPL — skala tekanan dijelaskan di atas. Default untuk pengukuran akustik.
- dB FS (decibel full scale) — digunakan dalam audio digital. 0 dB FS adalah nilai sampel digital maksimum representable; semua lainnya negatif. Tak dapat dibandingkan langsung dengan dB SPL tanpa kalibrasi referensi.
- dB SWL (sound power level) — daya absolut yang dipancarkan sumber, terlepas dari di mana Anda mengukurnya. Digunakan untuk peringkat peralatan.
- dBA / dBC / dBZ — pembobotan A, C, atau Z diterapkan ke pengukuran dB SPL. Selalu tentukan pembobotan bersama angka.
Frekuensi dan pitch
Telinga manusia merespons variasi tekanan dari sekitar 20 Hz di ujung rendah hingga sekitar 20 kHz di ujung tinggi, dengan batas atas menurun stabil dengan usia (orang 60 tahun tipikal mendengar hingga sekitar 12 kHz). Di bawah 20 Hz adalah infrasonik (lebih dirasakan daripada didengar); di atas 20 kHz adalah ultrasonik (peluit anjing sekitar 25 kHz; ultrasonik medis di rentang megahertz).
Dua skala digunakan untuk mengukur interval frekuensi:
- Oktav — penggandaan frekuensi. 100 Hz hingga 200 Hz adalah satu oktav; 200 Hz hingga 400 Hz berikutnya. Rentang yang dapat didengar kira-kira 10 oktav.
- Sepertiga oktav — tiga pita per oktav, tradisional dalam pengukuran akustik karena kira-kira mendekati resolusi frekuensi telinga. ISO 266 menentukan frekuensi pusat standar (...100, 125, 160, 200, 250, 315, 400...).
Suara nyata punya konten broadband: penghisap debu adalah energi tersebar di banyak pita frekuensi; garpu tala terkonsentrasi pada satu frekuensi. Sebagian besar kebisingan lingkungan adalah broadband; sebagian besar nada musik adalah pseudo-tonal (fundamental plus harmonik).
Pembobotan frekuensi
Telinga manusia tidak sama-sama sensitif ke semua frekuensi — jauh dari itu. Nada 60 dB pada 1 kHz terdengar secara signifikan lebih keras dari nada 60 dB pada 50 Hz, karena telinga lebih sensitif di rentang menengah dan jauh lebih sedikit di ujung rendah (dan agak kurang di atas ~5 kHz).
Mikrofon pengukuran, secara desain, datar — output listriknya proporsional ke tekanan akustik di seluruh rentang yang dapat didengar. Kedataran itu adalah titik awal yang tepat, tetapi itu berarti pengukuran mentah tidak mencerminkan bagaimana pendengar manusia mengalami suara. Untuk menjembatani gap itu, pengukur tingkat suara menerapkan filter pembobotan frekuensi sebelum menghitung level.
Empat pembobotan distandarisasi dalam IEC 61672‑1, dinamai secara historis dengan huruf:
Pembobotan A
Mendekati invers kontur kerasnya sama 40-phon. Sangat meredam frekuensi di bawah 500 Hz (sekitar −30 dB pada 50 Hz, −40 dB pada 20 Hz) dan sedikit di atas 6 kHz; hampir datar di rentang 1 – 5 kHz tempat telinga paling sensitif. Digunakan untuk hampir semua kebisingan kerja dan lingkungan (NIOSH, OSHA, WHO, ISO 1996, EU 2003/10).
Bentuk matematis adalah filter analog 4-kutub, 4-nol:
R_A(f) = (12194² × f⁴) / [ (f² + 20.6²) × √((f² + 107.7²)(f² + 737.9²)) × (f² + 12194²) ]
A(f) = 20 × log10( R_A(f) ) + 2.00 dB
Offset +2,00 dB menormalisasi pembobotan A ke 0 dB pada 1 kHz.
Pembobotan C
Jauh lebih datar dari A. Hanya meredam di ujung ekstrem rentang yang dapat didengar (sekitar −3 dB pada 31,5 Hz dan pada 8 kHz; sekitar −0,2 dB pada 50 Hz). Digunakan untuk pengukuran puncak (di mana energi puncak aktual lebih penting dari kerasnya yang dirasakan), untuk sumber frekuensi rendah seperti konser, subwoofer, dan guruh, dan secara historis untuk suara level tinggi di mana respons frekuensi telinga mendekati kontur 40 – 100 phon daripada kontur 40-phon yang didekati pembobotan A.
Pembobotan B dan D
B adalah pembobotan level menengah, dimaksudkan untuk tingkat suara moderat (50 – 60 phon). D spesifik untuk kebisingan pesawat. Keduanya telah usang oleh standar modern dan Anda jarang menemukannya dalam praktik.
Pembobotan Z
Pembobotan nol — respons datar di 10 Hz hingga 20 kHz. Digunakan untuk riset dan verifikasi instrumen. Menggantikan terminologi "linear" atau "tidak terbobot" lebih lama, yang tidak konsisten lintas produsen.
Saat ragu, gunakan pembobotan A. Saat mengukur sesuatu yang didominasi bass, juga laporkan pembobotan C; gap antara A dan C sendiri diagnostik dari konten spektral.
Kontur kerasnya sama
Ketergantungan frekuensi pendengaran manusia bukan kurva tunggal — itu bervariasi dengan level. Pada SPL rendah, Anda sangat tidak sensitif ke frekuensi rendah; pada SPL tinggi, kurva merata.
Data eksperimental klasik adalah Fletcher dan Munson 1933, dengan revisi modern distandarisasi sebagai ISO 226:2003. Keduanya menghasilkan keluarga kurva, masing-masing diberi label dengan nilai phon, di mana phon adalah SPL nada 1 kHz dirasakan sama keras dengan nada uji. Jadi kontur 40-phon menampilkan SPL dibutuhkan pada setiap frekuensi untuk terdengar sekeras nada 40 dB SPL pada 1 kHz.
Beberapa implikasi praktis:
- Pembobotan A memodelkan kontur 40-phon, jadi paling akurat untuk tingkat dengar moderat (40 – 60 dB SPL). Pada level tinggi (> 90 dB SPL), pembobotan A under-bobot frekuensi rendah relatif terhadap respons telinga sebenarnya.
- Phon adalah unit level kerasnya, bukan kerasnya sendiri.
- Sone adalah unit kerasnya yang dirasakan, didefinisikan sehingga penggandaan sone sesuai dengan penggandaan kerasnya yang dirasakan. 1 sone = 40 phon. 2 sone = 50 phon (aturan +10 phon = ×2 kerasnya).
Integrasi waktu
Mikrofon melaporkan nilai tekanan sesaat ribuan kali per detik. Melaporkan sampel tunggal apa pun sebagai "level" tidak berguna — sebaliknya, pengukur tingkat suara menghitung RMS terbobot waktu selama waktu integrasi yang dipilih:
p_rms(t) = sqrt( (1/τ) × integral( p²(s) × e^(-(t-s)/τ) ) ds )
Konstanta waktu τ mendefinisikan kecepatan respons:
- Fast (F) —
τ = 125 ms. Default untuk pengukuran lingkungan dan kerja. - Slow (S) —
τ = 1000 ms. Untuk kebisingan ambien stabil. - Impulse (I) —
τ_attack = 35 ms,τ_decay = 1500 ms. Menangkap transien singkat (tembakan, pukulan palu).
Untuk kebisingan yang bervariasi signifikan dari waktu ke waktu, SPL terbobot waktu mengedip. Sebagian besar standar regulator menggunakan tingkat kontinu setara (Leq atau LAeq untuk A-terbobot) — SPL stabil yang menyampaikan total energi akustik sama sebagai sinyal variabel aktual:
LAeq,T = 10 × log10( (1/T) × integral( 10^(LA(t)/10) ) dt )
Leq setara energi, aditif lintas waktu, dan dasar setiap standar kebisingan kerja modern. Deskriptor statistik lain kadang digunakan untuk kebisingan komunitas:
- L10, L50, L90 — level yang dilampaui 10 %, 50 %, 90 % dari periode pengukuran. L10 adalah level "puncak tipikal"; L90 adalah level "latar".
- Lden — rerata terbobot siang-sore-malam digunakan dalam pemetaan kebisingan komunitas UE. Mendenda level sore +5 dB dan level malam +10 dB.
- Lmax, Lpeak — maksimum kejadian tunggal. Lmax adalah terbobot waktu; Lpeak adalah puncak tekanan tak terbobot sesaat.
FFT dan analisis spektrum
Bentuk gelombang tekanan dalam domain waktu dapat diubah ke domain frekuensi menggunakan Transformasi Fourier Cepat (FFT). FFT mengambil jendela sampel audio dan menghasilkan spektrum kompleks yang menunjukkan amplitudo dan fase setiap bin frekuensi dalam jendela.
Beberapa properti FFT yang harus diketahui setiap pengguna:
- Resolusi bin = sample_rate / FFT_size. Sample rate 48 kHz dengan FFT 2048-titik memberi 23,4 Hz per bin — halus untuk musik dan ucapan, kasar untuk analisis frekuensi rendah di mana resolusi 1-Hz mungkin dibutuhkan.
- Fungsi jendela — mengalikan sampel waktu dengan jendela (Hann, Hamming, Blackman, Kaiser) sebelum FFT mengurangi kebocoran spektral dengan biaya lobus utama lebih lebar. Visualizer kami menggunakan jendela Hann.
- Ketidakpastian waktu-frekuensi. Jendela FFT lebih besar memberi resolusi frekuensi lebih halus tetapi resolusi waktu lebih kasar. Tak ada cara memiliki keduanya — Heisenberg, diterapkan ke akustik.
Untuk pengukuran lingkungan dan kerja, analisis sepertiga-oktav lebih berguna dari FFT pita-sempit. Analisator sepertiga-oktav mengelompokkan bin FFT ke pita yang bermakna secara perseptual (sama yang kira-kira diselesaikan telinga), yang membuat spektrum yang dihasilkan dapat dibaca dan sebanding dengan kurva penilaian kebisingan standar (NC, RC, NR).
Visualizer di pengukur kami menampilkan FFT pita-sempit untuk tujuan diagnostik — itu membuat sumber tonal melompat sebagai puncak tunggal. Untuk analisis frekuensi formal, gunakan SLM Kelas 2 dengan pita sepertiga-oktav bawaan.
Mengikatnya kembali ke pengukur
Setiap angka pada pengukur desibel adalah hasil:
- Sampling tekanan udara di mikrofon (halaman kalibrasi meliputi apa yang bisa salah di sini).
- Pembobotan A pada sinyal digital (atau C, atau Z, tergantung pengaturan).
- Mengkuadratkan, pembobotan waktu (Fast / Slow / Impulse), dan mengakar untuk menghasilkan tekanan RMS.
- Mengambil 20 × log10 dari rasio ke 20 µPa.
- Menambahkan offset kalibrasi pengguna.
Mengetahui rangkaian tidak mengubah pembacaan, tetapi memberitahu mengapa dua pengukur dapat tidak setuju: kalibrasi mikrofon berbeda, pembobotan berbeda, waktu integrasi berbeda, nilai referensi berbeda. Saat angka tidak cocok, jawabannya hampir selalu di suatu tempat dalam rangkaian ini.
Untuk interpretasi praktis pembacaan — apa yang dianggap keras, apa yang aman, regulasi apa yang berlaku — lihat tabel perbandingan, halaman kesehatan pendengaran, dan halaman standar tempat kerja. Untuk definisi istilah, glosarium adalah indeks kembali ke halaman ini.