By the Sound Decibel Meter Team

La scienza del suono: decibel, frequenze e udito

Ogni lettura del fonometro è la punta visibile di una catena di fisica, elaborazione del segnale e psicoacustica. Capire questa catena cambia le domande. Si smette di chiedere "90 dB sono rumorosi?" e si comincia a chiedere ciò che conta davvero: 90 dB rispetto a quale riferimento, con quale filtro di ponderazione, integrati su quale finestra temporale. Questa pagina percorre la fisica delle onde sonore, la matematica della scala dei decibel, le quattro ponderazioni frequenziali standard, le curve isofoniche, l'integrazione temporale e l'analisi spettrale via FFT. Alla fine dovrebbe essere in grado di leggere qualunque cifra di rumore pubblicata e sapere precisamente cosa dice e cosa non dice.

È la pagina tecnicamente più densa del sito. Per imparare, la legga dall'alto al basso. Per cercare un concetto preciso, il glossario rimanda alle sezioni opportune.

Il suono è un'onda di pressione

Il suono è un'onda longitudinale di variazione di pressione che si propaga in un mezzo elastico — di solito l'aria. Una sorgente che vibra comprime l'aria davanti a sé e la rarefa indietreggiando, e quel pattern compressione-rarefazione viaggia verso l'esterno alla velocità del suono (circa 343 m/s in aria a 20 °C, più lenta in aria fredda, più veloce in aria calda o in mezzi più densi come l'acqua).

La grandezza fisica a cui risponde un microfono è la pressione — la differenza fra la pressione locale istantanea e la pressione atmosferica stabile. La pressione atmosferica è circa 101 325 Pa (101 kPa); il suono più debole che un orecchio giovane e sano rileva — la soglia uditiva a 1 kHz — è una variazione di pressione di circa 20 micropascal (20 µPa), ovvero 20 × 10⁻⁶ Pa. La soglia del dolore è attorno a 20 Pa, un milione di volte più alta.

Quel rapporto di un milione in pressione motiva la scala logaritmica del decibel. Lavorare in pascal lineari su quel range produce numeri ingestibili (provi a confrontare 0,00002 con 20). La compressione logaritmica restituisce 0 – 120 dB, molto più semplici da scrivere e da maneggiare.

Un'onda di pressione ha tre descrittori chiave:

Ampiezza — magnitudine della variazione di pressione. Si lega al volume percepito, con forti non linearità (vedi curve isofoniche).
Frequenza — numero di cicli compressione-rarefazione al secondo, in hertz (Hz). Si lega al tono, anch'esso in modo non lineare.
Fase — in che punto del ciclo si trova l'onda in quell'istante. Quasi irrilevante per le misure di livello; importante per interferenze e configurazioni a più microfoni.

Per un tono sinusoidale puro, questi tre numeri descrivono integralmente il segnale. Il suono reale non è quasi mai un tono puro: è la somma di molte componenti a frequenze diverse, ciascuna con propria ampiezza e fase, variabili continuamente nel tempo.

La scala dei decibel

Il decibel non è un'unità — è un rapporto logaritmico fra due grandezze, convertito in numero usabile da un riferimento fisso al denominatore. Per il livello di pressione sonora (SPL) il riferimento standard è 20 µPa. Data una pressione misurata p, il SPL in decibel è:

L_p = 20 × log10( p / p_0 )       dove p_0 = 20 µPa

Il fattore 20 (al posto di 10) viene dal fatto che la pressione è proporzionale alla radice quadrata dell'intensità, e il decibel è un rapporto di potenza. Per l'intensità acustica:

L_I = 10 × log10( I / I_0 )       dove I_0 = 1 pW/m²

In campo libero le due formule danno lo stesso numero, e si parla indifferentemente di "dB" senza dover specificare quale.

Tre regole pratiche derivano direttamente dalla matematica:

+3 dB raddoppiano l'energia acustica. Due sorgenti identiche non correlate (60 dB ciascuna) sommano a 63 dB, non 66. Tre sorgenti identiche sommano a 60 + 10 log10(3) ≈ 64,8 dB.
+10 dB sono circa il doppio di forte per un ascoltatore umano. La moltiplicazione per 10 dell'intensità è compressa, dalla non linearità dell'orecchio, in un fattore 2 percettivo.
+6 dB raddoppiano la pressione ma quadruplicano l'intensità. Importante per la distanza: una sorgente puntiforme in campo libre, raddoppiando la distanza, perde 6 dB SPL.

La scala dei decibel ha varianti che disorientano i nuovi:

dB SPL — la scala di pressione descritta sopra. Default in misura acustica.
dB FS (decibel full scale) — usata in audio digitale. 0 dB FS è il valore di campione digitale massimo rappresentabile; tutto il resto è negativo. Non si confronta direttamente con dB SPL senza calibrazione di riferimento.
dB SWL (sound power level) — la potenza assoluta irradiata da una sorgente, indipendente dal punto di misura. Usata nei dati tecnici degli equipaggiamenti.
dBA / dBC / dBZ — ponderazioni A, C o Z applicate a una misura dB SPL. Specifichi sempre la ponderazione col numero.

Frequenza e tono

L'orecchio umano risponde a variazioni di pressione da circa 20 Hz nei bassi a circa 20 kHz negli acuti, con il limite superiore che cala con l'età (un adulto tipico di 60 anni sente fino a circa 12 kHz). Sotto i 20 Hz si parla di infrasuono (più sentito che udito); sopra i 20 kHz, di ultrasuono (un fischietto per cani sta attorno a 25 kHz; l'ecografia medica, in megahertz).

Due scale per gli intervalli di frequenza:

Ottave — raddoppio della frequenza. Da 100 a 200 Hz è un'ottava; da 200 a 400 Hz un'altra. La gamma udibile è di circa 10 ottave.
Terzi d'ottava — tre bande per ottava, tradizionali in misura acustica perché si avvicinano alla risoluzione frequenziale dell'orecchio. ISO 266 fissa le frequenze centrali standard (…100, 125, 160, 200, 250, 315, 400…).

I suoni reali hanno contenuto a banda larga: un aspirapolvere distribuisce energia su molte bande, mentre un diapason si concentra su una sola frequenza. La gran parte del rumore ambientale è a banda larga; la gran parte delle note musicali è pseudo-tonale (una fondamentale più armoniche).

Ponderazioni frequenziali

L'orecchio umano non è ugualmente sensibile a tutte le frequenze — niente affatto. Un tono a 60 dB a 1 kHz suona molto più forte di un tono a 60 dB a 50 Hz, perché l'orecchio è più sensibile in mezzo e molto meno sui bassi (e un po' meno sopra i 5 kHz).

Un microfono di misura è, per costruzione, piatto: l'uscita elettrica è proporzionale alla pressione acustica su tutta la gamma udibile. Quella piattezza è il giusto punto di partenza, ma significa che la misura grezza non riflette come un ascoltatore umano vive il suono. Per colmare il gap, i fonometri applicano un filtro di ponderazione frequenziale prima di calcolare il livello.

Quattro ponderazioni sono normate in IEC 61672‑1, denominate storicamente con lettere:

Ponderazione A

Approssima l'inverso della curva isofonica a 40 phon. Attenua fortemente le frequenze sotto 500 Hz (circa −30 dB a 50 Hz, −40 dB a 20 Hz) e leggermente sopra i 6 kHz; resta quasi piatta nella gamma 1 – 5 kHz, dove l'orecchio è più sensibile. Usata per quasi tutto il rumore occupazionale e ambientale (NIOSH, OSHA, OMS, ISO 1996, UE 2003/10).

La forma matematica è un filtro analogico a 4 poli e 4 zeri:

R_A(f) = (12194² × f⁴) / [ (f² + 20,6²) × √((f² + 107,7²)(f² + 737,9²)) × (f² + 12194²) ]
A(f) = 20 × log10( R_A(f) ) + 2,00 dB

L'offset di +2,00 dB normalizza la ponderazione A a 0 dB a 1 kHz.

Ponderazione C

Molto più piatta della A. Attenua solo agli estremi della gamma udibile (circa −3 dB a 31,5 Hz e 8 kHz; circa −0,2 dB a 50 Hz). Usata per le misure di picco (dove conta più l'energia reale del picco del volume percepito), per sorgenti ricche di basso (concerti, subwoofer, tuoni) e storicamente per livelli alti, dove la risposta dell'orecchio si avvicina più a una curva 40 – 100 phon che alla curva 40 phon che A approssima.

Ponderazioni B e D

La B era una ponderazione intermedia per livelli moderati (50 – 60 phon). La D era specifica per il rumore aeronautico. Le norme moderne le hanno ritirate e si vedono ormai raramente.

Ponderazione Z

Ponderazione zero — risposta piatta da 10 Hz a 20 kHz. Usata per ricerca e verifica strumenti. Sostituisce la vecchia "lineare" o "non ponderata", non coerente fra produttori.

Nel dubbio, A. Quando misura qualcosa dominato dai bassi, riporti anche C; lo scarto fra A e C è di per sé diagnostico del contenuto spettrale.

Curve isofoniche

La dipendenza dalla frequenza dell'udito umano non è una sola curva — varia con il livello. A SPL bassi si è poco sensibili ai bassi; a SPL alti la curva si appiattisce.

I dati sperimentali classici sono quelli di Fletcher e Munson del 1933, con revisioni moderne normate in ISO 226:2003. Entrambi producono una famiglia di curve, etichettate ciascuna con un valore in phon, dove il phon è il SPL di un tono a 1 kHz percepito altrettanto forte del tono di prova. Così, la curva a 40 phon indica il SPL necessario a ogni frequenza per suonare forte come un tono a 40 dB SPL a 1 kHz.

Implicazioni pratiche:

La ponderazione A modella la curva a 40 phon, dunque è più precisa a livelli moderati (40 – 60 dB SPL). A livelli alti (> 90 dB SPL), A sottostima i bassi rispetto a come l'orecchio risponde davvero.
Il phon è un'unità di livello di sonorità, non di sonorità in sé.
Il sone è un'unità di sonorità percepita, definita perché raddoppiare i sone corrisponda al raddoppio della sonorità percepita. 1 sone = 40 phon. 2 sone = 50 phon (la regola "+10 phon = doppio di forte").

Integrazione temporale

Un microfono fornisce un valore istantaneo di pressione migliaia di volte al secondo. Riportare un singolo campione come "il livello" non serve a niente — i fonometri calcolano un RMS ponderato nel tempo su una costante d'integrazione scelta:

p_rms(t) = sqrt( (1/τ) × integral( p²(s) × e^(-(t-s)/τ) ) ds )

La costante di tempo τ definisce la velocità di risposta:

Fast (F) — τ = 125 ms. Default per misure ambientali e occupazionali.
Slow (S) — τ = 1000 ms. Per rumore ambientale stabile.
Impulse (I) — τ_attacco = 35 ms, τ_rilascio = 1500 ms. Cattura transitori brevi (spari, colpi di martello).

Per rumore molto variabile nel tempo, il SPL ponderato nel tempo sfarfalla. La maggior parte delle norme usa al suo posto il livello continuo equivalente (Leq o LAeq per A) — il SPL costante che fornisce la stessa energia acustica totale del segnale variabile reale:

LAeq,T = 10 × log10( (1/T) × integral( 10^(LA(t)/10) ) dt )

Leq è equivalente in energia, additivo nel tempo, e base di qualunque norma moderna di rumore occupazionale. Nel rumore di comunità si usano talvolta altri descrittori statistici:

L10, L50, L90 — livello superato il 10 %, 50 %, 90 % del periodo di misura. L10 è un "picco tipico"; L90 un "fondo".
Lden — media pesata giorno-sera-notte usata nelle mappe di rumore di comunità UE. Penalizza la sera di +5 dB e la notte di +10 dB.
Lmax, Lpeak — massimi per evento. Lmax è ponderato nel tempo; Lpeak è il picco istantaneo non ponderato.

FFT e analisi spettrale

Una forma d'onda di pressione nel dominio del tempo può essere trasformata nel dominio della frequenza tramite la trasformata di Fourier veloce (FFT). La FFT prende una finestra di campioni e produce uno spettro complesso con ampiezza e fase di ogni bin di frequenza nella finestra.

Alcune proprietà utili:

Risoluzione del bin = frequenza di campionamento / dimensione FFT. A 48 kHz con FFT di 2048 punti si hanno 23,4 Hz per bin — fini per musica e voce, grossolani per analisi sui bassi dove può servire 1 Hz di risoluzione.
Funzione finestra — moltiplicare i campioni temporali per una finestra (Hann, Hamming, Blackman, Kaiser) prima della FFT riduce la perdita spettrale al prezzo di lobi principali più larghi. Il nostro visualizzatore usa una finestra Hann.
Indeterminazione tempo-frequenza. Finestre FFT più ampie danno migliore risoluzione frequenziale ma peggiore temporale. Non si possono avere entrambe — Heisenberg, applicato all'acustica.

Per misure ambientali e occupazionali, l'analisi in terzi d'ottava è più utile della FFT a banda stretta. Un analizzatore in terzi d'ottava raggruppa i bin FFT in bande percettivamente significative (quelle che l'orecchio risolve approssimativamente), rendendo lo spettro leggibile e confrontabile con curve standard di valutazione del rumore (NC, RC, NR).

Il visualizzatore del fonometro mostra una FFT a banda stretta a fini diagnostici — fa apparire le sorgenti tonali come picchi isolati. Per analisi formale in frequenza, usi un SLM classe 2 con bande in terzi d'ottava integrate.

Ritorno al fonometro

Ogni numero del fonometro è il risultato di:

Campionare la pressione dell'aria al microfono (la pagina di calibrazione copre cosa può andar storto qui).
Applicare la ponderazione A al segnale digitale (o C, o Z, secondo le impostazioni).
Elevare al quadrato, ponderare nel tempo (Fast / Slow / Impulse), estrarre la radice per ottenere una pressione RMS.
Calcolare 20 × log10 del rapporto a 20 µPa.
Sommare il calibration offset utente.

Conoscere la catena non cambia le letture, ma dice perché due fonometri possono divergere: calibrazioni di microfono diverse, ponderazioni diverse, tempi d'integrazione diversi, valori di riferimento diversi. Quando i numeri non tornano, la risposta è quasi sempre da qualche parte in questa catena.

Per l'interpretazione pratica delle letture — cosa si considera rumoroso, cosa è sicuro, quale norma si applica — consulti la tabella comparativa, la pagina salute uditiva e la pagina sul lavoro. Per le definizioni dei termini, il glossario è l'indice di ritorno a questa pagina.

Open the decibel meter