La science du son : décibels, fréquences et audition
Chaque lecture du sonomètre est l'extrémité visible d'une chaîne de physique, de traitement du signal et de psychoacoustique. Comprendre cette chaîne change les questions. On ne demande plus « 90 dB, c'est bruyant ? » mais ce qui compte vraiment : 90 dB par rapport à quelle référence, avec quel filtre de pondération, intégrés sur quelle fenêtre de temps. Cette page parcourt la physique des ondes sonores, les mathématiques de l'échelle des décibels, les quatre pondérations fréquentielles standard, les courbes isosoniques, l'intégration temporelle et l'analyse spectrale par FFT. Au bout, vous devriez pouvoir lire n'importe quel chiffre de bruit publié et savoir précisément ce qu'il dit, et ce qu'il ne dit pas.
C'est la page la plus dense techniquement du site. Pour apprendre, lisez-la de haut en bas. Pour chercher un concept précis, le glossaire renvoie aux sections concernées.
Le son est une onde de pression
Le son est une onde longitudinale de variation de pression qui se propage dans un milieu élastique — généralement l'air. Une source qui vibre comprime l'air devant elle et le raréfie en reculant, et ce motif compression-raréfaction voyage vers l'extérieur à la vitesse du son (environ 343 m/s dans l'air à 20 °C, plus lente dans l'air froid, plus rapide dans l'air chaud ou un milieu plus dense comme l'eau).
La grandeur physique à laquelle répond un microphone est la pression — l'écart entre la pression locale instantanée et la pression atmosphérique stable. La pression atmosphérique vaut environ 101 325 Pa (101 kPa) ; le son le plus faible que détecte une oreille jeune et saine — le seuil d'audition à 1 kHz — est une variation de pression d'environ 20 micropascals (20 µPa), soit 20 × 10⁻⁶ Pa. Le seuil de la douleur est autour de 20 Pa, un million de fois plus haut.
Ce rapport de un million en pression motive l'échelle logarithmique du décibel. Travailler en pascals linéaires sur cette plage produit des chiffres ingérables (comparer 0,00002 à 20). La compression logarithmique donne 0 à 120 dB, beaucoup plus faciles à écrire et à manipuler.
Une onde de pression a trois descripteurs clés :
- Amplitude — magnitude de la variation de pression. Liée au volume perçu, avec de fortes non-linéarités (voir courbes isosoniques plus bas).
- Fréquence — nombre de cycles compression-raréfaction par seconde, en hertz (Hz). Liée à la hauteur, là aussi non linéairement.
- Phase — où l'onde en est dans son cycle à cet instant. Quasiment sans incidence pour les mesures de niveau ; importante pour l'interférence et les montages multimicrophones.
Pour un ton sinusoïdal pur, ces trois nombres décrivent intégralement le signal. Le son réel n'est presque jamais un ton pur : il est la somme de nombreuses composantes à des fréquences différentes, chacune avec son amplitude et sa phase, variant continûment dans le temps.
L'échelle des décibels
Le décibel n'est pas une unité — c'est un rapport logarithmique entre deux grandeurs, converti en nombre utilisable par une référence fixe au dénominateur. Pour le niveau de pression acoustique (SPL), la référence standard est 20 µPa. Étant donné une pression mesurée p, le SPL en décibels est :
L_p = 20 × log10( p / p_0 ) où p_0 = 20 µPa
Le facteur 20 (au lieu de 10) vient de ce que la pression est proportionnelle à la racine carrée de l'intensité, et le décibel est un rapport de puissance. Pour l'intensité acoustique :
L_I = 10 × log10( I / I_0 ) où I_0 = 1 pW/m²
En champ libre, les deux formules donnent le même nombre, et l'on dit indifféremment « dB » sans avoir à préciser laquelle.
Trois règles pratiques découlent directement des maths :
- +3 dB doublent l'énergie acoustique. Deux sources identiques non corrélées (chacune à 60 dB) somment à 63 dB, pas 66 dB. Trois sources identiques somment à 60 + 10 log10(3) ≈ 64,8 dB.
- +10 dB, c'est environ deux fois plus fort pour un auditeur humain. La multiplication par 10 de l'intensité est compressée, par la non-linéarité de l'oreille, en un facteur 2 perceptuel.
- +6 dB doublent la pression mais quadruplent l'intensité. Important pour la distance : doubler la distance à une source ponctuelle en champ libre baisse le SPL de 6 dB.
L'échelle des décibels a aussi des variantes qui troublent les nouveaux venus :
- dB SPL — l'échelle de pression décrite plus haut. Le défaut en mesure acoustique.
- dB FS (decibel full scale) — utilisé en audio numérique. 0 dB FS est la valeur d'échantillon numérique maximale ; tout le reste est négatif. Ne se compare pas directement à dB SPL sans étalonnage.
- dB SWL (sound power level) — la puissance absolue rayonnée par une source, indépendamment du point de mesure. Utilisé dans les fiches techniques d'équipements.
- dBA / dBC / dBZ — pondérations A, C ou Z appliquées à une mesure dB SPL. Indiquez toujours la pondération avec le chiffre.
Fréquence et hauteur
L'oreille humaine répond à des variations de pression depuis environ 20 Hz dans le grave jusqu'à environ 20 kHz dans l'aigu, avec une limite supérieure qui descend avec l'âge (un adulte typique de 60 ans entend jusqu'à environ 12 kHz). Sous 20 Hz, on parle d'infrason (plus ressenti qu'entendu) ; au-dessus de 20 kHz, d'ultrason (un sifflet à chien est autour de 25 kHz ; l'échographie médicale, en mégahertz).
Deux échelles servent à mesurer les intervalles de fréquence :
- Octaves — doublement de la fréquence. De 100 à 200 Hz : une octave ; de 200 à 400 Hz : une autre. La plage audible fait environ 10 octaves.
- Tiers d'octave — trois bandes par octave, traditionnels en mesure acoustique parce qu'ils approchent la résolution fréquentielle de l'oreille. ISO 266 fixe les fréquences centrales standard (…100, 125, 160, 200, 250, 315, 400…).
Les sons réels ont un contenu à large bande : un aspirateur répartit son énergie sur de nombreuses bandes, alors qu'un diapason se concentre sur une seule fréquence. La majeure partie du bruit ambiant est à large bande ; la majeure partie des notes musicales est pseudo-tonale (une fondamentale plus des harmoniques).
Pondérations fréquentielles
L'oreille humaine n'est pas également sensible à toutes les fréquences — loin de là. Un ton à 60 dB à 1 kHz semble nettement plus fort qu'un ton à 60 dB à 50 Hz, parce que l'oreille est plus sensible dans les médiums et beaucoup moins dans les graves (et un peu moins au-dessus de 5 kHz environ).
Un microphone de mesure est, par construction, plat : sa sortie électrique est proportionnelle à la pression acoustique sur toute la plage audible. Cette platitude est le bon point de départ, mais elle implique que la mesure brute ne reflète pas comment un auditeur humain expérimente le son. Pour combler l'écart, les sonomètres appliquent un filtre de pondération fréquentielle avant de calculer le niveau.
Quatre pondérations sont normalisées dans IEC 61672‑1, historiquement nommées par lettres :
Pondération A
Approche l'inverse de la courbe isosonique de 40 phones. Atténue fortement les fréquences sous 500 Hz (environ −30 dB à 50 Hz, −40 dB à 20 Hz) et légèrement au-dessus de 6 kHz ; reste presque plate dans la plage 1 – 5 kHz, où l'oreille est la plus sensible. Utilisée pour presque tout le bruit professionnel et environnemental (NIOSH, OSHA, OMS, ISO 1996, UE 2003/10).
La forme mathématique est un filtre analogique à 4 pôles et 4 zéros :
R_A(f) = (12194² × f⁴) / [ (f² + 20,6²) × √((f² + 107,7²)(f² + 737,9²)) × (f² + 12194²) ]
A(f) = 20 × log10( R_A(f) ) + 2,00 dB
Le décalage de +2,00 dB normalise la pondération A à 0 dB à 1 kHz.
Pondération C
Beaucoup plus plate que A. N'atténue qu'aux extrémités de la plage audible (environ −3 dB à 31,5 Hz et 8 kHz ; environ −0,2 dB à 50 Hz). Utilisée pour les mesures de crête (où l'énergie réelle du pic compte plus que le volume perçu), pour les sources riches en grave (concerts, caissons, tonnerre) et historiquement pour les sons à fort niveau, où la réponse fréquentielle de l'oreille se rapproche d'une courbe 40 – 100 phones plutôt que de la courbe 40 phones que la pondération A approche.
Pondérations B et D
La B était une pondération intermédiaire pour les niveaux modérés (50 – 60 phones). La D était spécifique au bruit aérien. Les normes modernes les ont retirées et on ne les rencontre quasiment plus.
Pondération Z
Pondération zéro — réponse plate de 10 Hz à 20 kHz. Utilisée pour la recherche et la vérification d'instruments. Remplace l'ancienne « linéaire » ou « non pondérée », qui n'était pas cohérente entre fabricants.
Dans le doute, A. Quand vous mesurez quelque chose dominé par les graves, rapportez aussi C ; l'écart entre A et C est en lui-même diagnostique du contenu spectral.
Courbes isosoniques
La dépendance fréquentielle de l'audition humaine n'est pas une seule courbe — elle varie avec le niveau. À faible SPL, on est très peu sensible aux graves ; à fort SPL, la courbe s'aplatit.
Les données expérimentales classiques sont celles de Fletcher et Munson en 1933, avec des révisions modernes normalisées dans ISO 226:2003. Toutes deux produisent une famille de courbes, étiquetée chacune en phones, où le phone est le SPL d'un ton à 1 kHz perçu aussi fort que le ton d'essai. Ainsi, la courbe à 40 phones donne le SPL nécessaire à chaque fréquence pour sonner aussi fort qu'un ton à 40 dB SPL à 1 kHz.
Quelques implications pratiques :
- La pondération A modélise la courbe à 40 phones, donc elle est plus précise à des niveaux modérés (40 – 60 dB SPL). À niveau élevé (> 90 dB SPL), la pondération A sous-estime les graves par rapport à la réponse réelle de l'oreille.
- Le phone est une unité de niveau de sonie, pas de sonie elle-même.
- Le sone est une unité de sonie perçue, définie pour que doubler les sones double la sonie perçue. 1 sone = 40 phones. 2 sones = 50 phones (la règle « +10 phones = deux fois plus fort »).
Intégration temporelle
Un microphone livre une valeur instantanée de pression des milliers de fois par seconde. Reporter un seul échantillon comme « le niveau » ne sert à rien — les sonomètres calculent un RMS pondéré dans le temps sur une constante d'intégration choisie :
p_rms(t) = sqrt( (1/τ) × integral( p²(s) × e^(-(t-s)/τ) ) ds )
La constante de temps τ définit la vitesse de réponse :
- Fast (F) —
τ = 125 ms. Choix par défaut pour les mesures environnementales et professionnelles. - Slow (S) —
τ = 1000 ms. Pour un bruit ambiant stable. - Impulse (I) —
τ_attaque = 35 ms,τ_retombée = 1500 ms. Capte les transitoires brefs (coups de feu, coups de marteau).
Pour un bruit fortement variable, le SPL pondéré dans le temps clignote. La plupart des normes utilisent à la place le niveau continu équivalent (Leq ou LAeq pour A) — le SPL constant qui délivre la même énergie acoustique totale que le signal variable :
LAeq,T = 10 × log10( (1/T) × integral( 10^(LA(t)/10) ) dt )
Leq est équivalent en énergie, additif dans le temps, et la base de toute norme moderne de bruit professionnel. En bruit communautaire, on utilise parfois d'autres descripteurs statistiques :
- L10, L50, L90 — niveau dépassé 10 %, 50 %, 90 % de la durée de mesure. L10 est un « pic typique » ; L90 un « fond ».
- Lden — moyenne pondérée jour-soir-nuit utilisée dans les cartes de bruit communautaire de l'UE. Pénalise la soirée de +5 dB et la nuit de +10 dB.
- Lmax, Lpeak — maxima par événement. Lmax est pondéré dans le temps ; Lpeak est le pic instantané non pondéré.
FFT et analyse spectrale
Une forme d'onde de pression dans le domaine temporel peut être transformée vers le domaine fréquentiel par la transformée de Fourier rapide (FFT). La FFT prend une fenêtre d'échantillons et produit un spectre complexe avec l'amplitude et la phase de chaque bin de fréquence dans la fenêtre.
Quelques propriétés utiles à connaître :
- Résolution du bin = fréquence d'échantillonnage / taille FFT. Une fréquence d'échantillonnage de 48 kHz avec une FFT de 2048 points donne 23,4 Hz par bin — fin pour la musique et la voix, grossier pour de l'analyse en très basses fréquences où il peut falloir 1 Hz de résolution.
- Fonction fenêtre — multiplier les échantillons temporels par une fenêtre (Hann, Hamming, Blackman, Kaiser) avant la FFT réduit la fuite spectrale au prix de lobes principaux plus larges. Notre visualiseur utilise une fenêtre Hann.
- Incertitude temps-fréquence. Des fenêtres FFT plus larges donnent une meilleure résolution fréquentielle mais une moins bonne résolution temporelle. Pas moyen d'avoir les deux — Heisenberg, appliqué à l'acoustique.
Pour les mesures environnementales et professionnelles, l'analyse en tiers d'octave est plus utile que la FFT en bande étroite. Un analyseur en tiers d'octave regroupe les bins FFT en bandes perceptuellement significatives (celles que l'oreille résout à peu près), ce qui rend le spectre lisible et comparable aux courbes standards d'évaluation de bruit (NC, RC, NR).
Le visualiseur du sonomètre montre une FFT en bande étroite à des fins de diagnostic — il fait apparaître les sources tonales comme des pics isolés. Pour une analyse fréquentielle formelle, utilisez un SLM classe 2 avec bandes de tiers d'octave intégrées.
Retour au sonomètre
Chaque chiffre du sonomètre est le résultat de :
- Échantillonnage de la pression d'air au microphone (la page d'étalonnage couvre ce qui peut mal tourner ici).
- Application de la pondération A au signal numérique (ou C, ou Z, selon les réglages).
- Mise au carré, pondération temporelle (Fast / Slow / Impulse), extraction de la racine pour obtenir une pression RMS.
- Calcul de 20 × log10 du rapport à 20 µPa.
- Ajout du calibration offset utilisateur.
Connaître la chaîne ne change pas les lectures, mais elle dit pourquoi deux sonomètres peuvent diverger : étalonnage de micro différent, pondérations différentes, durées d'intégration différentes, valeurs de référence différentes. Quand les chiffres ne collent pas, la réponse est presque toujours quelque part dans cette chaîne.
Pour l'interprétation pratique des lectures — qui compte comme bruyant, qui est sûr, quelle réglementation s'applique — voir le tableau comparatif, la page santé auditive et la page sur le travail. Pour les définitions, le glossaire est l'index de retour vers cette page.