A ciência do som: decibéis, frequências e audição explicados
Cada leitura de um decibelímetro é a ponta visível de uma cadeia de física, processamento de sinais e psicoacústica. Entender essa cadeia torna as leituras úteis — você deixa de perguntar "90 dB é alto?" e começa a fazer as perguntas mais úteis: 90 dB em comparação com qual referência, através de qual filtro de ponderação, integrado em qual janela de tempo. Esta página percorre a física das ondas sonoras, a matemática da escala de decibéis, as quatro ponderações de frequência padrão, as curvas de mesma intensidade auditiva, a integração temporal e a análise de espectro por FFT. Ao terminar, você deve conseguir ler qualquer número de ruído publicado e saber exatamente o que ele significa e o que não significa.
Esta é a página técnica mais longa do site. Se está aqui para aprender, leia de cima a baixo. Se veio para consultar um conceito específico, o glossário faz referência cruzada à seção correspondente desta página para cada termo.
O som é uma onda de pressão
O som é uma onda longitudinal de variação de pressão que se propaga por um meio elástico — em geral, o ar. Uma fonte vibrante comprime o ar à sua frente, depois o rarefaz ao recuar, e esse padrão de compressão e rarefação se desloca para fora à velocidade do som (cerca de 343 m/s no ar a 20 °C, mais devagar no ar frio, mais rápido no quente ou em meios mais densos como a água).
A grandeza física à qual o microfone responde é pressão — a diferença entre a pressão local instantânea do ar e a pressão atmosférica estável. A pressão atmosférica é cerca de 101.325 Pa (101 kPa); o som mais fraco que um ouvido jovem e saudável detecta — o limiar auditivo a 1 kHz — é uma variação de pressão de cerca de 20 micropascais (20 µPa), ou 20 × 10⁻⁶ Pa. O limiar da dor fica em torno de 20 Pa, um milhão de vezes maior.
Essa razão de um milhão em pressão é o que motiva a escala logarítmica de decibéis. Trabalhar com pascais lineares nessa faixa produz números difíceis de manejar (compare 0,00002 com 20). A compressão logarítmica produz 0 dB a 120 dB, muito mais fácil de escrever e de raciocinar.
Uma onda de pressão tem três descritores fundamentais:
- Amplitude — a magnitude da variação de pressão. Mapeia para a sensação de volume, com fortes não linearidades (veja curvas de mesma intensidade abaixo).
- Frequência — o número de ciclos de compressão e rarefação por segundo, em hertz (Hz). Mapeia para o tom, novamente com não linearidades.
- Fase — em que ponto do ciclo a onda está. Em geral irrelevante para medições de nível, importante para interferência e arranjos com vários microfones.
Para um tom senoidal puro, esses três números descrevem totalmente o sinal. Sons reais quase nunca são tons puros — são somas de muitos componentes em frequências diferentes, cada um com amplitude e fase próprias, variando continuamente no tempo.
A escala de decibéis
O decibel não é uma unidade — é uma razão logarítmica entre duas grandezas, transformada em número usável por referência a um denominador fixo. Para o nível de pressão sonora (SPL), a referência padrão é 20 µPa. Dada uma pressão medida p, o SPL em decibéis é:
L_p = 20 × log10( p / p_0 ) onde p_0 = 20 µPa
O fator 20 (em vez de 10) existe porque a pressão é proporcional à raiz quadrada da intensidade, e o decibel é uma razão de potência. Para intensidade acústica:
L_I = 10 × log10( I / I_0 ) onde I_0 = 1 pW/m²
Em campo livre, ambas as fórmulas dão o mesmo número, motivo pelo qual a maioria das pessoas as usa de forma intercambiável e por que "dB" é uma resposta significativa sem especificar qual.
Três regras de bolso saem direto da matemática:
- +3 dB dobram a energia acústica. Duas fontes incoerentes idênticas (cada uma a 60 dB) somam 63 dB, não 66 dB. Três fontes idênticas somam 60 + 10 log10(3) ≈ 64,8 dB.
- +10 dB são cerca de 2× mais altas para o ouvinte humano. O aumento de 10× em intensidade é comprimido para cerca de 2× em sensação por causa da não linearidade da audição humana.
- +6 dB dobram a pressão, mas adicionam só 4× a intensidade. Isso importa para distância: uma fonte pontual em campo livre, ao dobrar a distância, vê o SPL cair 6 dB.
A escala de decibéis também tem variantes que confundem iniciantes:
- dB SPL — a escala de pressão acima. Padrão para medições acústicas.
- dB FS (decibel full scale) — usada em áudio digital. 0 dB FS é o valor de amostra digital máximo representável; o resto é negativo. Não pode ser comparado diretamente com dB SPL sem calibração de referência.
- dB SWL (sound power level) — a potência absoluta irradiada por uma fonte, independente de onde se mede. Usada em ratings de equipamento.
- dBA / dBC / dBZ — ponderação A, C ou Z aplicada a uma medição em dB SPL. Sempre informe a ponderação ao lado do número.
Frequência e tom
O ouvido humano responde a variações de pressão de cerca de 20 Hz na ponta baixa até cerca de 20 kHz na ponta alta, com o limite superior caindo continuamente com a idade (uma pessoa típica de 60 anos ouve até cerca de 12 kHz). Abaixo de 20 Hz é infrasom (mais sentido do que ouvido); acima de 20 kHz é ultrassom (apito de cachorro fica em torno de 25 kHz; ultrassom médico está na faixa de megahertz).
Duas escalas medem intervalos de frequência:
- Oitavas — uma duplicação de frequência. 100 Hz a 200 Hz é uma oitava; 200 Hz a 400 Hz é a próxima. A faixa audível tem aproximadamente 10 oitavas.
- Bandas de 1/3 de oitava — três bandas por oitava, tradicionais em medições acústicas porque aproximam grosseiramente a resolução em frequência do ouvido. A ISO 266 especifica as frequências centrais padrão (...100, 125, 160, 200, 250, 315, 400...).
Sons reais têm conteúdo de banda larga: um aspirador de pó é energia espalhada em muitas bandas de frequência; um diapasão concentra-se numa única frequência. A maior parte do ruído ambiental é de banda larga; a maior parte das notas musicais é pseudotonal (uma fundamental mais harmônicos).
Ponderações de frequência
O ouvido humano não é igualmente sensível a todas as frequências — longe disso. Um tom de 60 dB a 1 kHz soa significativamente mais alto do que um tom de 60 dB a 50 Hz, porque o ouvido é mais sensível na faixa média e bem menos sensível na ponta baixa (e um pouco menos acima de ~5 kHz).
Um microfone de medição é, por concepção, plano — sua saída elétrica é proporcional à pressão acústica em toda a faixa audível. Essa planicidade é o ponto de partida certo, mas significa que a medição crua não reflete como o ouvinte humano experimenta o som. Para preencher essa lacuna, sonômetros aplicam um filtro de ponderação de frequência antes de calcular o nível.
Quatro ponderações estão padronizadas na IEC 61672‑1, nomeadas historicamente por letra:
Ponderação A
Aproxima o inverso da curva de mesma intensidade auditiva de 40 fons. Atenua fortemente frequências abaixo de 500 Hz (cerca de −30 dB a 50 Hz, −40 dB a 20 Hz) e levemente acima de 6 kHz; quase plana na faixa de 1 – 5 kHz, onde o ouvido é mais sensível. Usada em quase todo ruído ocupacional e ambiental (NIOSH, OSHA, WHO, ISO 1996, UE 2003/10).
A forma matemática é um filtro analógico de 4 polos e 4 zeros:
R_A(f) = (12194² × f⁴) / [ (f² + 20.6²) × √((f² + 107.7²)(f² + 737.9²)) × (f² + 12194²) ]
A(f) = 20 × log10( R_A(f) ) + 2.00 dB
O offset de +2,00 dB normaliza a ponderação A para 0 dB a 1 kHz.
Ponderação C
Bem mais plana do que A. Atenua só nos extremos da faixa audível (cerca de −3 dB a 31,5 Hz e a 8 kHz; cerca de −0,2 dB a 50 Hz). Usada para medições de pico (em que a energia real do pico importa mais do que a sensação), para fontes de baixa frequência como shows, subwoofers e trovões, e historicamente para sons de alto nível em que a resposta em frequência do ouvido se aproxima de uma curva de 40 – 100 fons em vez da de 40 fons que a ponderação A aproxima.
Ponderações B e D
A B era uma ponderação de nível intermediário, para níveis moderados (50 – 60 fons). A D era específica para ruído de aeronaves. Ambas foram descontinuadas pelas normas modernas e raramente aparecem na prática.
Ponderação Z
Ponderação zero — resposta plana de 10 Hz a 20 kHz. Usada em pesquisa e verificação de instrumento. Substituiu a antiga terminologia "linear" ou "não ponderada", inconsistente entre fabricantes.
Na dúvida, use ponderação A. Ao medir algo dominado por grave, reporte também C; o gap entre A e C é em si diagnóstico do conteúdo espectral.
Curvas de mesma intensidade auditiva
A dependência de frequência da audição humana não é uma única curva — varia com o nível. Em SPLs baixos, você é muito insensível a frequências baixas; em SPLs altos, a curva fica mais plana.
Os dados experimentais clássicos são os de Fletcher e Munson 1933, com revisões modernas padronizadas como ISO 226:2003. Ambos produzem uma família de curvas, cada uma rotulada por um valor em fons, em que o fon é o SPL de um tom a 1 kHz percebido como tão alto quanto o tom de teste. Ou seja, a curva de 40 fons mostra o SPL necessário em cada frequência para soar tão alto quanto um tom de 40 dB SPL a 1 kHz.
Algumas implicações práticas:
- A ponderação A modela a curva de 40 fons, sendo mais exata para níveis de escuta moderados (40 – 60 dB SPL). Em níveis altos (> 90 dB SPL), a ponderação A subestima as frequências baixas em relação a como o ouvido de fato responde.
- O fon é unidade de nível de loudness, não de loudness em si.
- O sone é unidade de loudness percebido, definido para que dobrar os sones corresponda a dobrar o loudness percebido. 1 sone = 40 fons. 2 sones = 50 fons (a regra +10 fons = 2× loudness).
Integração temporal
Um microfone reporta um valor instantâneo de pressão muitos milhares de vezes por segundo. Reportar uma única amostra como "o nível" é inútil — em vez disso, sonômetros calculam um RMS ponderado no tempo ao longo de um tempo de integração escolhido:
p_rms(t) = sqrt( (1/τ) × integral( p²(s) × e^(-(t-s)/τ) ) ds )
A constante de tempo τ define a velocidade de resposta:
- Fast (F) —
τ = 125 ms. Padrão para medições ambientais e ocupacionais. - Slow (S) —
τ = 1000 ms. Para ruído ambiente estável. - Impulse (I) —
τ_attack = 35 ms,τ_decay = 1500 ms. Captura transientes breves (disparos, marteladas).
Para ruído que varia bastante no tempo, o SPL ponderado no tempo oscila. A maioria das normas regulatórias usa em vez disso o nível contínuo equivalente (Leq ou LAeq para ponderação A) — o SPL estável que entrega a mesma energia acústica total que o sinal variável real:
LAeq,T = 10 × log10( (1/T) × integral( 10^(LA(t)/10) ) dt )
Leq é equivalente em energia, aditivo no tempo e é a base de toda norma moderna de ruído ocupacional. Outros descritores estatísticos são usados às vezes para ruído comunitário:
- L10, L50, L90 — o nível ultrapassado em 10 %, 50 %, 90 % do período de medição. L10 é um nível "típico de pico"; L90 é um nível de "fundo".
- Lden — média ponderada dia-tarde-noite usada em mapeamento de ruído comunitário da UE. Penaliza níveis vespertinos em +5 dB e noturnos em +10 dB.
- Lmax, Lpeak — máximos por evento e níveis de pressão de pico. Lmax é ponderado no tempo; Lpeak é o pico não ponderado instantâneo.
FFT e análise de espectro
Uma forma de onda de pressão no domínio do tempo pode ser transformada para o domínio da frequência usando a Transformada Rápida de Fourier (FFT). A FFT pega uma janela de amostras de áudio e produz um espectro complexo que mostra amplitude e fase de cada bin de frequência dentro da janela.
Algumas propriedades da FFT que todo usuário deve conhecer:
- Resolução do bin = sample_rate / FFT_size. Uma taxa de amostragem de 48 kHz com FFT de 2048 pontos dá 23,4 Hz por bin — fina para música e fala, grosseira para análise de baixa frequência em que pode ser preciso resolução de 1 Hz.
- Função de janela — multiplicar as amostras temporais por uma janela (Hann, Hamming, Blackman, Kaiser) antes da FFT reduz o vazamento espectral, ao custo de lobos principais mais largos. Nosso visualizador usa janela Hann.
- Incerteza tempo-frequência. Janelas FFT maiores dão resolução em frequência mais fina, porém resolução temporal mais grosseira. Não há como ter ambas — Heisenberg, aplicado à acústica.
Para medições ambientais e ocupacionais, a análise em 1/3 de oitava é mais útil do que FFT em banda estreita. Um analisador de 1/3 de oitava agrupa os bins do FFT em bandas perceptualmente significativas (as mesmas que o ouvido aproximadamente resolve), o que torna o espectro resultante legível e comparável a curvas de classificação de ruído padronizadas (NC, RC, NR).
O visualizador do nosso medidor mostra FFT de banda estreita para fins diagnósticos — fontes tonais saltam como picos isolados. Para análise formal em frequência, use um SLM Classe 2 com bandas de 1/3 de oitava embutidas.
Voltando para o medidor
Cada número do decibelímetro é resultado de:
- Amostrar a pressão do ar no microfone (a página de calibração cobre o que pode dar errado aqui).
- Aplicar ponderação A ao sinal digital (ou C, ou Z, conforme as configurações).
- Elevar ao quadrado, ponderar no tempo (Fast / Slow / Impulse) e tirar a raiz para produzir uma pressão RMS.
- Tirar 20 × log10 da razão para 20 µPa.
- Somar o offset de calibração do usuário.
Conhecer a cadeia não muda as leituras, mas ajuda a entender por que dois medidores podem discordar: calibrações de microfone diferentes, ponderações diferentes, tempos de integração diferentes, valores de referência diferentes. Quando os números não batem, a resposta está quase sempre em algum ponto desta cadeia.
Para interpretação prática das leituras — o que conta como alto, o que é seguro, quais regulações se aplicam —, veja a tabela de comparação, a página de saúde auditiva e a página de normas trabalhistas. Para definições de termos, o glossário é o índice de volta a esta página.