By the Sound Decibel Meter Team

A ciência do som: decibéis, frequências e audição explicados

Cada leitura de um decibelímetro é a ponta visível de uma cadeia de física, processamento de sinais e psicoacústica. Entender essa cadeia torna as leituras úteis — você deixa de perguntar "90 dB é alto?" e começa a fazer as perguntas mais úteis: 90 dB em comparação com qual referência, através de qual filtro de ponderação, integrado em qual janela de tempo. Esta página percorre a física das ondas sonoras, a matemática da escala de decibéis, as quatro ponderações de frequência padrão, as curvas de mesma intensidade auditiva, a integração temporal e a análise de espectro por FFT. Ao terminar, você deve conseguir ler qualquer número de ruído publicado e saber exatamente o que ele significa e o que não significa.

Esta é a página técnica mais longa do site. Se está aqui para aprender, leia de cima a baixo. Se veio para consultar um conceito específico, o glossário faz referência cruzada à seção correspondente desta página para cada termo.

O som é uma onda de pressão

O som é uma onda longitudinal de variação de pressão que se propaga por um meio elástico — em geral, o ar. Uma fonte vibrante comprime o ar à sua frente, depois o rarefaz ao recuar, e esse padrão de compressão e rarefação se desloca para fora à velocidade do som (cerca de 343 m/s no ar a 20 °C, mais devagar no ar frio, mais rápido no quente ou em meios mais densos como a água).

A grandeza física à qual o microfone responde é pressão — a diferença entre a pressão local instantânea do ar e a pressão atmosférica estável. A pressão atmosférica é cerca de 101.325 Pa (101 kPa); o som mais fraco que um ouvido jovem e saudável detecta — o limiar auditivo a 1 kHz — é uma variação de pressão de cerca de 20 micropascais (20 µPa), ou 20 × 10⁻⁶ Pa. O limiar da dor fica em torno de 20 Pa, um milhão de vezes maior.

Essa razão de um milhão em pressão é o que motiva a escala logarítmica de decibéis. Trabalhar com pascais lineares nessa faixa produz números difíceis de manejar (compare 0,00002 com 20). A compressão logarítmica produz 0 dB a 120 dB, muito mais fácil de escrever e de raciocinar.

Uma onda de pressão tem três descritores fundamentais:

Amplitude — a magnitude da variação de pressão. Mapeia para a sensação de volume, com fortes não linearidades (veja curvas de mesma intensidade abaixo).
Frequência — o número de ciclos de compressão e rarefação por segundo, em hertz (Hz). Mapeia para o tom, novamente com não linearidades.
Fase — em que ponto do ciclo a onda está. Em geral irrelevante para medições de nível, importante para interferência e arranjos com vários microfones.

Para um tom senoidal puro, esses três números descrevem totalmente o sinal. Sons reais quase nunca são tons puros — são somas de muitos componentes em frequências diferentes, cada um com amplitude e fase próprias, variando continuamente no tempo.

A escala de decibéis

O decibel não é uma unidade — é uma razão logarítmica entre duas grandezas, transformada em número usável por referência a um denominador fixo. Para o nível de pressão sonora (SPL), a referência padrão é 20 µPa. Dada uma pressão medida p, o SPL em decibéis é:

L_p = 20 × log10( p / p_0 )       onde p_0 = 20 µPa

O fator 20 (em vez de 10) existe porque a pressão é proporcional à raiz quadrada da intensidade, e o decibel é uma razão de potência. Para intensidade acústica:

L_I = 10 × log10( I / I_0 )       onde I_0 = 1 pW/m²

Em campo livre, ambas as fórmulas dão o mesmo número, motivo pelo qual a maioria das pessoas as usa de forma intercambiável e por que "dB" é uma resposta significativa sem especificar qual.

Três regras de bolso saem direto da matemática:

+3 dB dobram a energia acústica. Duas fontes incoerentes idênticas (cada uma a 60 dB) somam 63 dB, não 66 dB. Três fontes idênticas somam 60 + 10 log10(3) ≈ 64,8 dB.
+10 dB são cerca de 2× mais altas para o ouvinte humano. O aumento de 10× em intensidade é comprimido para cerca de 2× em sensação por causa da não linearidade da audição humana.
+6 dB dobram a pressão, mas adicionam só 4× a intensidade. Isso importa para distância: uma fonte pontual em campo livre, ao dobrar a distância, vê o SPL cair 6 dB.

A escala de decibéis também tem variantes que confundem iniciantes:

dB SPL — a escala de pressão acima. Padrão para medições acústicas.
dB FS (decibel full scale) — usada em áudio digital. 0 dB FS é o valor de amostra digital máximo representável; o resto é negativo. Não pode ser comparado diretamente com dB SPL sem calibração de referência.
dB SWL (sound power level) — a potência absoluta irradiada por uma fonte, independente de onde se mede. Usada em ratings de equipamento.
dBA / dBC / dBZ — ponderação A, C ou Z aplicada a uma medição em dB SPL. Sempre informe a ponderação ao lado do número.

Frequência e tom

O ouvido humano responde a variações de pressão de cerca de 20 Hz na ponta baixa até cerca de 20 kHz na ponta alta, com o limite superior caindo continuamente com a idade (uma pessoa típica de 60 anos ouve até cerca de 12 kHz). Abaixo de 20 Hz é infrasom (mais sentido do que ouvido); acima de 20 kHz é ultrassom (apito de cachorro fica em torno de 25 kHz; ultrassom médico está na faixa de megahertz).

Duas escalas medem intervalos de frequência:

Oitavas — uma duplicação de frequência. 100 Hz a 200 Hz é uma oitava; 200 Hz a 400 Hz é a próxima. A faixa audível tem aproximadamente 10 oitavas.
Bandas de 1/3 de oitava — três bandas por oitava, tradicionais em medições acústicas porque aproximam grosseiramente a resolução em frequência do ouvido. A ISO 266 especifica as frequências centrais padrão (...100, 125, 160, 200, 250, 315, 400...).

Sons reais têm conteúdo de banda larga: um aspirador de pó é energia espalhada em muitas bandas de frequência; um diapasão concentra-se numa única frequência. A maior parte do ruído ambiental é de banda larga; a maior parte das notas musicais é pseudotonal (uma fundamental mais harmônicos).

Ponderações de frequência

O ouvido humano não é igualmente sensível a todas as frequências — longe disso. Um tom de 60 dB a 1 kHz soa significativamente mais alto do que um tom de 60 dB a 50 Hz, porque o ouvido é mais sensível na faixa média e bem menos sensível na ponta baixa (e um pouco menos acima de ~5 kHz).

Um microfone de medição é, por concepção, plano — sua saída elétrica é proporcional à pressão acústica em toda a faixa audível. Essa planicidade é o ponto de partida certo, mas significa que a medição crua não reflete como o ouvinte humano experimenta o som. Para preencher essa lacuna, sonômetros aplicam um filtro de ponderação de frequência antes de calcular o nível.

Quatro ponderações estão padronizadas na IEC 61672‑1, nomeadas historicamente por letra:

Ponderação A

Aproxima o inverso da curva de mesma intensidade auditiva de 40 fons. Atenua fortemente frequências abaixo de 500 Hz (cerca de −30 dB a 50 Hz, −40 dB a 20 Hz) e levemente acima de 6 kHz; quase plana na faixa de 1 – 5 kHz, onde o ouvido é mais sensível. Usada em quase todo ruído ocupacional e ambiental (NIOSH, OSHA, WHO, ISO 1996, UE 2003/10).

A forma matemática é um filtro analógico de 4 polos e 4 zeros:

R_A(f) = (12194² × f⁴) / [ (f² + 20.6²) × √((f² + 107.7²)(f² + 737.9²)) × (f² + 12194²) ]
A(f) = 20 × log10( R_A(f) ) + 2.00 dB

O offset de +2,00 dB normaliza a ponderação A para 0 dB a 1 kHz.

Ponderação C

Bem mais plana do que A. Atenua só nos extremos da faixa audível (cerca de −3 dB a 31,5 Hz e a 8 kHz; cerca de −0,2 dB a 50 Hz). Usada para medições de pico (em que a energia real do pico importa mais do que a sensação), para fontes de baixa frequência como shows, subwoofers e trovões, e historicamente para sons de alto nível em que a resposta em frequência do ouvido se aproxima de uma curva de 40 – 100 fons em vez da de 40 fons que a ponderação A aproxima.

Ponderações B e D

A B era uma ponderação de nível intermediário, para níveis moderados (50 – 60 fons). A D era específica para ruído de aeronaves. Ambas foram descontinuadas pelas normas modernas e raramente aparecem na prática.

Ponderação Z

Ponderação zero — resposta plana de 10 Hz a 20 kHz. Usada em pesquisa e verificação de instrumento. Substituiu a antiga terminologia "linear" ou "não ponderada", inconsistente entre fabricantes.

Na dúvida, use ponderação A. Ao medir algo dominado por grave, reporte também C; o gap entre A e C é em si diagnóstico do conteúdo espectral.

Curvas de mesma intensidade auditiva

A dependência de frequência da audição humana não é uma única curva — varia com o nível. Em SPLs baixos, você é muito insensível a frequências baixas; em SPLs altos, a curva fica mais plana.

Os dados experimentais clássicos são os de Fletcher e Munson 1933, com revisões modernas padronizadas como ISO 226:2003. Ambos produzem uma família de curvas, cada uma rotulada por um valor em fons, em que o fon é o SPL de um tom a 1 kHz percebido como tão alto quanto o tom de teste. Ou seja, a curva de 40 fons mostra o SPL necessário em cada frequência para soar tão alto quanto um tom de 40 dB SPL a 1 kHz.

Algumas implicações práticas:

A ponderação A modela a curva de 40 fons, sendo mais exata para níveis de escuta moderados (40 – 60 dB SPL). Em níveis altos (> 90 dB SPL), a ponderação A subestima as frequências baixas em relação a como o ouvido de fato responde.
O fon é unidade de nível de loudness, não de loudness em si.
O sone é unidade de loudness percebido, definido para que dobrar os sones corresponda a dobrar o loudness percebido. 1 sone = 40 fons. 2 sones = 50 fons (a regra +10 fons = 2× loudness).

Integração temporal

Um microfone reporta um valor instantâneo de pressão muitos milhares de vezes por segundo. Reportar uma única amostra como "o nível" é inútil — em vez disso, sonômetros calculam um RMS ponderado no tempo ao longo de um tempo de integração escolhido:

p_rms(t) = sqrt( (1/τ) × integral( p²(s) × e^(-(t-s)/τ) ) ds )

A constante de tempo τ define a velocidade de resposta:

Fast (F) — τ = 125 ms. Padrão para medições ambientais e ocupacionais.
Slow (S) — τ = 1000 ms. Para ruído ambiente estável.
Impulse (I) — τ_attack = 35 ms, τ_decay = 1500 ms. Captura transientes breves (disparos, marteladas).

Para ruído que varia bastante no tempo, o SPL ponderado no tempo oscila. A maioria das normas regulatórias usa em vez disso o nível contínuo equivalente (Leq ou LAeq para ponderação A) — o SPL estável que entrega a mesma energia acústica total que o sinal variável real:

LAeq,T = 10 × log10( (1/T) × integral( 10^(LA(t)/10) ) dt )

Leq é equivalente em energia, aditivo no tempo e é a base de toda norma moderna de ruído ocupacional. Outros descritores estatísticos são usados às vezes para ruído comunitário:

L10, L50, L90 — o nível ultrapassado em 10 %, 50 %, 90 % do período de medição. L10 é um nível "típico de pico"; L90 é um nível de "fundo".
Lden — média ponderada dia-tarde-noite usada em mapeamento de ruído comunitário da UE. Penaliza níveis vespertinos em +5 dB e noturnos em +10 dB.
Lmax, Lpeak — máximos por evento e níveis de pressão de pico. Lmax é ponderado no tempo; Lpeak é o pico não ponderado instantâneo.

FFT e análise de espectro

Uma forma de onda de pressão no domínio do tempo pode ser transformada para o domínio da frequência usando a Transformada Rápida de Fourier (FFT). A FFT pega uma janela de amostras de áudio e produz um espectro complexo que mostra amplitude e fase de cada bin de frequência dentro da janela.

Algumas propriedades da FFT que todo usuário deve conhecer:

Resolução do bin = sample_rate / FFT_size. Uma taxa de amostragem de 48 kHz com FFT de 2048 pontos dá 23,4 Hz por bin — fina para música e fala, grosseira para análise de baixa frequência em que pode ser preciso resolução de 1 Hz.
Função de janela — multiplicar as amostras temporais por uma janela (Hann, Hamming, Blackman, Kaiser) antes da FFT reduz o vazamento espectral, ao custo de lobos principais mais largos. Nosso visualizador usa janela Hann.
Incerteza tempo-frequência. Janelas FFT maiores dão resolução em frequência mais fina, porém resolução temporal mais grosseira. Não há como ter ambas — Heisenberg, aplicado à acústica.

Para medições ambientais e ocupacionais, a análise em 1/3 de oitava é mais útil do que FFT em banda estreita. Um analisador de 1/3 de oitava agrupa os bins do FFT em bandas perceptualmente significativas (as mesmas que o ouvido aproximadamente resolve), o que torna o espectro resultante legível e comparável a curvas de classificação de ruído padronizadas (NC, RC, NR).

O visualizador do nosso medidor mostra FFT de banda estreita para fins diagnósticos — fontes tonais saltam como picos isolados. Para análise formal em frequência, use um SLM Classe 2 com bandas de 1/3 de oitava embutidas.

Voltando para o medidor

Cada número do decibelímetro é resultado de:

Amostrar a pressão do ar no microfone (a página de calibração cobre o que pode dar errado aqui).
Aplicar ponderação A ao sinal digital (ou C, ou Z, conforme as configurações).
Elevar ao quadrado, ponderar no tempo (Fast / Slow / Impulse) e tirar a raiz para produzir uma pressão RMS.
Tirar 20 × log10 da razão para 20 µPa.
Somar o offset de calibração do usuário.

Conhecer a cadeia não muda as leituras, mas ajuda a entender por que dois medidores podem discordar: calibrações de microfone diferentes, ponderações diferentes, tempos de integração diferentes, valores de referência diferentes. Quando os números não batem, a resposta está quase sempre em algum ponto desta cadeia.

Para interpretação prática das leituras — o que conta como alto, o que é seguro, quais regulações se aplicam —, veja a tabela de comparação, a página de saúde auditiva e a página de normas trabalhistas. Para definições de termos, o glossário é o índice de volta a esta página.

Open the decibel meter