La ciencia del sonido: decibelios, frecuencias y audición
Cada lectura del sonómetro es el extremo visible de una cadena de física, procesado de señal y psicoacústica. Entender esa cadena cambia las preguntas. Dejas de preguntar "¿90 dB es ruidoso?" para empezar a preguntar lo que sí importa: 90 dB respecto a qué referencia, con qué filtro de ponderación, integrados en qué ventana de tiempo. Esta página recorre la física de las ondas sonoras, la matemática de la escala de decibelios, las cuatro ponderaciones frecuenciales estándar, las curvas isofónicas, la integración temporal y el análisis espectral por FFT. Al final deberías poder leer cualquier cifra de ruido publicada y saber con precisión qué dice y qué no dice.
Es la página técnicamente más densa del sitio. Si vienes a aprender, léela de arriba a abajo. Si vienes a buscar un concepto concreto, el glosario tiene enlaces cruzados a las secciones que correspondan.
El sonido es una onda de presión
El sonido es una onda longitudinal de variación de presión que se propaga por un medio elástico — habitualmente el aire. Una fuente que vibra comprime el aire delante de ella y lo enrarece al retroceder, y ese patrón compresión-rarefacción viaja hacia fuera a la velocidad del sonido (aproximadamente 343 m/s en aire a 20 °C, más despacio en aire frío y más rápido en aire caliente o en medios más densos como el agua).
La magnitud física a la que responde un micrófono es la presión — la diferencia entre la presión local instantánea del aire y la presión atmosférica estable. La presión atmosférica son unos 101 325 Pa (101 kPa); el sonido más débil que un oído joven y sano detecta — el umbral auditivo a 1 kHz — es una variación de presión de unos 20 micropascales (20 µPa), o 20 × 10⁻⁶ Pa. El umbral del dolor está alrededor de 20 Pa, un millón de veces más alto.
Esa relación de un millón en presión es lo que motiva la escala logarítmica del decibelio. Trabajar con pascales lineales en ese rango produce cifras inmanejables (compara 0,00002 con 20). Comprimir el rango logarítmicamente produce 0 a 120 dB, mucho más fácil de escribir y de razonar.
Una onda de presión tiene tres descriptores clave:
- Amplitud — magnitud de la variación de presión. Se relaciona con el volumen percibido, con fuertes no linealidades (ver curvas isofónicas más abajo).
- Frecuencia — número de ciclos compresión-rarefacción por segundo, en hercios (Hz). Se relaciona con el tono, también de forma no lineal.
- Fase — en qué punto del ciclo está la onda en este instante. Casi irrelevante para medidas de nivel; importante para interferencia y montajes con varios micrófonos.
Para un tono puro sinusoidal, esos tres números describen completamente la señal. El sonido real casi nunca es un tono puro: es la suma de muchas componentes a frecuencias distintas, cada una con su amplitud y fase, variando continuamente en el tiempo.
La escala de decibelios
El decibelio no es una unidad — es una relación logarítmica entre dos magnitudes, convertida en un número usable mediante una referencia fija en el denominador. Para nivel de presión sonora (SPL), la referencia estándar es 20 µPa. Dada una presión medida p, el SPL en decibelios es:
L_p = 20 × log10( p / p_0 ) donde p_0 = 20 µPa
El factor 20 (en lugar de 10) viene de que la presión es proporcional a la raíz cuadrada de la intensidad, y el decibelio es una relación de potencia. Para intensidad acústica:
L_I = 10 × log10( I / I_0 ) donde I_0 = 1 pW/m²
En campo libre las dos fórmulas dan el mismo número, por lo que se usan indistintamente y "dB" es una respuesta significativa sin tener que aclarar cuál es.
Tres reglas prácticas salen directamente de la matemática:
- +3 dB duplica la energía acústica. Dos fuentes idénticas no correlacionadas (cada una a 60 dB) suman 63 dB, no 66 dB. Tres fuentes idénticas suman 60 + 10 log10(3) ≈ 64,8 dB.
- +10 dB es aproximadamente el doble de fuerte para un oyente humano. El aumento de 10 veces la intensidad se comprime, por la no linealidad del oído, en algo así como un factor 2 perceptual.
- +6 dB duplica la presión pero solo cuadruplica la intensidad. Esto importa para distancia: una fuente puntual en campo libre, al duplicar la distancia, baja el SPL 6 dB.
La escala de decibelios tiene además variantes que confunden a los recién llegados:
- dB SPL — la escala de presión descrita arriba. La opción por defecto en medidas acústicas.
- dB FS (decibel full scale) — usada en audio digital. 0 dB FS es el valor de muestra digital máximo representable; todo lo demás es negativo. No se compara directamente con dB SPL sin una calibración de referencia.
- dB SWL (sound power level) — la potencia absoluta radiada por una fuente, independiente del punto de medida. Se usa en datos técnicos de equipos.
- dBA / dBC / dBZ — ponderaciones A, C o Z aplicadas a una medida en dB SPL. Especifica siempre la ponderación junto al número.
Frecuencia y tono
El oído humano responde a variaciones de presión desde unos 20 Hz en el extremo grave hasta unos 20 kHz en el agudo, con el límite superior bajando con la edad (un adulto típico de 60 años oye hasta unos 12 kHz). Por debajo de 20 Hz hablamos de infrasonido (más sentido que oído); por encima de 20 kHz, de ultrasonido (un silbato para perros está alrededor de 25 kHz; el ultrasonido médico, en megahercios).
Se usan dos escalas para medir intervalos de frecuencia:
- Octavas — duplicación de la frecuencia. De 100 a 200 Hz hay una octava; de 200 a 400 Hz, otra. El rango audible son aproximadamente 10 octavas.
- Tercios de octava — tres bandas por octava, tradicionales en medida acústica porque se aproximan a la resolución frecuencial del oído. ISO 266 fija las frecuencias centrales estándar (…100, 125, 160, 200, 250, 315, 400…).
Los sonidos reales tienen contenido de banda ancha: una aspiradora reparte energía por muchas bandas, mientras que un diapasón se concentra en una sola frecuencia. La mayor parte del ruido ambiental es de banda ancha; la mayor parte de las notas musicales son pseudotonal (una fundamental más armónicos).
Ponderaciones frecuenciales
El oído humano no es igual de sensible a todas las frecuencias — para nada. Un tono de 60 dB a 1 kHz suena bastante más fuerte que un tono de 60 dB a 50 Hz, porque el oído es más sensible en el rango medio y mucho menos sensible en los graves (y algo menos por encima de unos 5 kHz).
Un micrófono de medida es, por diseño, plano: su salida eléctrica es proporcional a la presión acústica en todo el rango audible. Esa planitud es el punto de partida correcto, pero significa que la medida cruda no refleja cómo experimenta el sonido un oyente humano. Para cubrir esa diferencia, los sonómetros aplican un filtro de ponderación frecuencial antes de calcular el nivel.
Cuatro ponderaciones se estandarizan en la IEC 61672‑1, nombradas históricamente con letras:
Ponderación A
Aproxima la inversa de la curva isofónica de 40 fonios. Atenúa fuertemente las frecuencias por debajo de 500 Hz (unos −30 dB a 50 Hz, −40 dB a 20 Hz) y ligeramente por encima de 6 kHz; queda casi plana en el rango 1 – 5 kHz, donde el oído es más sensible. Se usa para casi todo el ruido ocupacional y ambiental (NIOSH, OSHA, WHO, ISO 1996, UE 2003/10).
La forma matemática es un filtro analógico de 4 polos y 4 ceros:
R_A(f) = (12194² × f⁴) / [ (f² + 20,6²) × √((f² + 107,7²)(f² + 737,9²)) × (f² + 12194²) ]
A(f) = 20 × log10( R_A(f) ) + 2,00 dB
El desplazamiento de +2,00 dB normaliza la ponderación A a 0 dB en 1 kHz.
Ponderación C
Mucho más plana que A. Atenúa solo en los extremos del rango audible (unos −3 dB a 31,5 Hz y a 8 kHz; unos −0,2 dB a 50 Hz). Se usa en mediciones de pico (donde importa la energía real del pico más que su volumen percibido), en fuentes con mucho grave como conciertos, subwoofers y truenos, e históricamente en sonidos de nivel alto, donde la respuesta frecuencial del oído se acerca más a una curva de 40 – 100 fonios que a la curva de 40 fonios que aproxima la ponderación A.
Ponderaciones B y D
La B fue una ponderación intermedia, pensada para niveles moderados (50 – 60 fonios). La D era específica para ruido de aviación. Las normas modernas las han retirado y rara vez se ven en la práctica.
Ponderación Z
Ponderación cero — respuesta plana de 10 Hz a 20 kHz. Se usa para investigación y verificación de instrumentos. Sustituyó a la antigua "lineal" o "sin ponderar", que no era consistente entre fabricantes.
Ante la duda, ponderación A. Cuando midas algo dominado por graves, reporta también C; la diferencia entre A y C es en sí misma diagnóstica del contenido espectral.
Curvas isofónicas
La dependencia frecuencial de la audición humana no es una sola curva — varía con el nivel. A SPL bajos eres muy poco sensible a los graves; a SPL altos, la curva se aplana.
Los datos experimentales clásicos son los de Fletcher y Munson de 1933, con revisiones modernas estandarizadas en ISO 226:2003. Ambos producen una familia de curvas, cada una etiquetada con un valor en fonios, donde el fonio es el SPL de un tono de 1 kHz que se percibe igual de fuerte que el tono de prueba. Así, la curva de 40 fonios indica el SPL necesario en cada frecuencia para sonar tan fuerte como un tono de 40 dB SPL a 1 kHz.
Algunas implicaciones prácticas:
- La ponderación A modela la curva de 40 fonios, así que es más precisa a niveles moderados (40 – 60 dB SPL). A niveles altos (> 90 dB SPL), la ponderación A subestima los graves respecto a cómo responde realmente el oído.
- El fonio es una unidad de nivel de sonoridad, no de sonoridad en sí.
- El sonio es una unidad de sonoridad percibida, definida de forma que duplicar los sonios corresponde a duplicar la sonoridad percibida. 1 sonio = 40 fonios. 2 sonios = 50 fonios (la regla de "+10 fonios = doble de fuerte").
Integración temporal
Un micrófono entrega un valor instantáneo de presión miles de veces por segundo. Reportar una sola muestra como "el nivel" no sirve de nada — los sonómetros calculan un RMS ponderado en el tiempo sobre un tiempo de integración elegido:
p_rms(t) = sqrt( (1/τ) × integral( p²(s) × e^(-(t-s)/τ) ) ds )
La constante de tiempo τ define la velocidad de respuesta:
- Fast (F) —
τ = 125 ms. La opción por defecto para medidas ambientales y ocupacionales. - Slow (S) —
τ = 1000 ms. Para ruido ambiental estable. - Impulse (I) —
τ_ataque = 35 ms,τ_caída = 1500 ms. Capta transitorios breves (disparos, golpes de martillo).
Para ruido que varía mucho con el tiempo, el SPL ponderado en el tiempo parpadea. La mayoría de normas usan en su lugar el nivel continuo equivalente (Leq o LAeq para A) — el SPL constante que entrega la misma energía acústica total que la señal variable real:
LAeq,T = 10 × log10( (1/T) × integral( 10^(LA(t)/10) ) dt )
Leq es energéticamente equivalente, aditivo en el tiempo, y la base de cualquier norma moderna de ruido ocupacional. En ruido comunitario se usan a veces otros descriptores estadísticos:
- L10, L50, L90 — el nivel superado el 10 %, 50 %, 90 % del periodo de medida. L10 es un "pico típico"; L90, un "fondo".
- Lden — promedio ponderado día-tarde-noche usado en mapas de ruido comunitario de la UE. Penaliza la tarde con +5 dB y la noche con +10 dB.
- Lmax, Lpeak — máximos por evento. Lmax es ponderado en el tiempo; Lpeak es el pico instantáneo sin ponderar.
FFT y análisis espectral
Una forma de onda de presión en el dominio temporal puede transformarse al dominio frecuencial mediante la transformada rápida de Fourier (FFT). La FFT toma una ventana de muestras y produce un espectro complejo con la amplitud y fase de cada bin de frecuencia dentro de la ventana.
Algunas propiedades que conviene conocer:
- Resolución del bin = frecuencia de muestreo / tamaño de la FFT. Una frecuencia de muestreo de 48 kHz con FFT de 2048 puntos da 23,4 Hz por bin — fino para música y voz, grueso para análisis en bajas frecuencias donde puede hacer falta 1 Hz de resolución.
- Función ventana — multiplicar las muestras temporales por una ventana (Hann, Hamming, Blackman, Kaiser) antes de la FFT reduce la fuga espectral a costa de lóbulos principales más anchos. Nuestro visualizador usa una ventana Hann.
- Incertidumbre tiempo-frecuencia. Ventanas FFT más grandes dan mejor resolución frecuencial pero peor resolución temporal. No hay forma de tener las dos — Heisenberg, aplicado a la acústica.
Para medidas ambientales y ocupacionales, el análisis en tercios de octava es más útil que el FFT de banda estrecha. Un analizador de tercios de octava agrupa los bins FFT en bandas perceptualmente significativas (las que aproximadamente resuelve el oído), lo que hace el espectro resultante legible y comparable con curvas estándar de evaluación de ruido (NC, RC, NR).
El visualizador del sonómetro muestra FFT de banda estrecha con fines diagnósticos — hace que las fuentes tonales se vean como picos aislados. Para análisis frecuencial formal, usa un SLM Clase 2 con bandas de tercio de octava integradas.
Volver al sonómetro
Cada número del sonómetro es el resultado de:
- Muestrear la presión del aire en el micrófono (la página de calibración cubre lo que puede salir mal aquí).
- Aplicar ponderación A a la señal digital (o C, o Z, según ajustes).
- Elevar al cuadrado, ponderar en el tiempo (Fast / Slow / Impulse) y extraer la raíz para obtener una presión RMS.
- Calcular 20 × log10 de la relación con 20 µPa.
- Sumar el desplazamiento de calibración del usuario.
Conocer la cadena no cambia las lecturas, pero te dice por qué dos sonómetros pueden discrepar: distintas calibraciones de micrófono, distintas ponderaciones, distintos tiempos de integración, distintos valores de referencia. Cuando los números no encajan, la respuesta está casi siempre en algún punto de esta cadena.
Para interpretación práctica de las lecturas — qué cuenta como ruidoso, qué es seguro, qué normativa aplica — consulta la tabla comparativa, la página de salud auditiva y la página de normativa laboral. Para definiciones de términos, el glosario es el índice de vuelta a esta página.