By the Sound Decibel Meter Team

Ljudets vetenskap: decibel, frekvenser och hörsel

Varje avläsning från bullermätaren är den synliga änden av en kedja av fysik, signalbehandling och psykoakustik. Förstår du kedjan ändras dina frågor. Du slutar fråga ”är 90 dB högt?” och börjar med det som faktiskt spelar roll: 90 dB mot vilken referens, med vilket vägningsfilter, integrerat över vilket tidsfönster? Den här sidan tar upp ljudvågens fysik, decibelskalans matematik, de fyra standardfrekvensvägningarna, isofonkurvor, tidsintegration och spektrumanalys via FFT. När du är klar bör du kunna läsa varje publicerad bullernivå och veta exakt vad den säger och inte säger.

Det är sajtens tekniskt tätaste sida. Läser du för att lära — gå uppifrån och ner. Söker du ett enskilt begrepp — ordlistan länkar till rätt avsnitt.

Ljud är en tryckvåg

Ljud är en longitudinell tryckvåg som färdas i ett elastiskt medium — oftast luft. En vibrerande källa komprimerar luften framför sig och förtunnar den när den drar sig tillbaka, och kompressions–förtunningsmönstret rör sig utåt med ljudets hastighet (cirka 343 m/s i luft vid 20 °C, lägre i kall luft, högre i varm luft eller tätare medier som vatten).

Den fysiska storhet en mikrofon reagerar på är tryck — skillnaden mellan momentant lokalt lufttryck och stabilt atmosfärstryck. Atmosfärstrycket är cirka 101 325 Pa (101 kPa); det svagaste ljud ett ungt friskt öra fångar — hörseltröskeln vid 1 kHz — är en tryckvariation på cirka 20 mikropascal (20 µPa), eller 20 × 10⁻⁶ Pa. Smärttröskeln ligger runt 20 Pa, en miljon gånger högre.

Det miljonfaldiga förhållandet i tryck motiverar den logaritmiska decibelskalan. Att jobba i linjära pascal i det intervallet ger ohanterliga siffror (jämför 0,00002 med 20). Logaritmisk komprimering ger 0 – 120 dB, mycket lättare att skriva och resonera kring.

En tryckvåg har tre viktiga deskriptorer:

Amplitud — tryckvariationens storlek. Hör ihop med upplevd ljudstyrka, med starka olinjäriteter (se isofonkurvor).
Frekvens — antalet kompression-förtunningscykler per sekund, i hertz (Hz). Hör ihop med tonhöjd, också olinjärt.
Fas — var i cykeln vågen ligger just nu. Vid nivåmätningar nästan irrelevant; viktig vid interferens och flera mikrofoner.

För en ren sinusgång beskriver de tre talen signalen helt. Verkligt ljud är nästan aldrig en ren ton: det är summan av många komponenter på olika frekvenser, var och en med egen amplitud och fas, ständigt varierande över tid.

Decibelskalan

Decibel är ingen enhet — det är ett logaritmiskt förhållande mellan två storheter, omgjort till ett användbart tal av en fast referens i nämnaren. För ljudtrycksnivå (SPL) är referensen 20 µPa. För uppmätt tryck p är SPL i decibel:

L_p = 20 × log10( p / p_0 )       där p_0 = 20 µPa

Faktor 20 (i stället för 10) kommer av att tryck är proportionellt mot roten ur intensiteten, och decibeln är ett effektförhållande. För akustisk intensitet:

L_I = 10 × log10( I / I_0 )       där I_0 = 1 pW/m²

I fritt fält ger båda formlerna samma tal och man skriver bara ”dB” utan vidare förklaring.

Tre tumregler följer direkt av matematiken:

+3 dB fördubblar den akustiska energin. Två identiska okorrelerade källor (60 dB var) summeras till 63 dB, inte 66. Tre identiska summeras till 60 + 10 log10(3) ≈ 64,8 dB.
+10 dB är ungefär dubbelt så högt för en mänsklig lyssnare. Tio gånger intensitetsökning komprimeras av örats olinjäritet till en perceptuell faktor 2.
+6 dB fördubblar trycket men fyrdubblar intensiteten. Viktigt vid avstånd: en punktkälla i fritt fält tappar 6 dB SPL per avståndsdubbling.

Decibelskalan har också varianter som förvirrar nykomlingar:

dB SPL — den ovan beskrivna tryckskalan. Standard i akustiska mätningar.
dB FS (decibel full scale) — används i digitalt ljud. 0 dB FS är största tänkbara digitala sampelvärde; allt annat är negativt. Inte direkt jämförbar med dB SPL utan referenskalibrering.
dB SWL (sound power level) — den absoluta effekt en källa strålar ut, oberoende av mätpunkt. Används i utrustningsspecifikationer.
dBA / dBC / dBZ — A-, C- eller Z-vägning lagd på en dB SPL-mätning. Ange alltid vägningen tillsammans med talet.

Frekvens och tonhöjd

Det mänskliga örat reagerar på tryckvariationer från cirka 20 Hz i basen till cirka 20 kHz i diskanten, med övre gränsen som sjunker med åldern (en typisk 60-åring hör till ungefär 12 kHz). Under 20 Hz pratar vi om infraljud (mer känt än hört); över 20 kHz om ultraljud (en hundvissla ligger runt 25 kHz; medicinskt ultraljud i megahertz).

Två skalor för frekvensintervall:

Oktaver — frekvensdubbling. Från 100 till 200 Hz är en oktav; från 200 till 400 Hz ännu en. Det hörbara området täcker ungefär 10 oktaver.
Tersband (tredjedels oktaver) — tre band per oktav, traditionellt i akustik eftersom de approximerar örats frekvensupplösning. ISO 266 fastställer standardmittfrekvenserna (…100, 125, 160, 200, 250, 315, 400…).

Riktiga ljud har bredbandig innehåll: en dammsugare sprider energi över många band, medan en stämgaffel koncentrerar sig på en frekvens. Det mesta miljöbullret är bredbandigt; de flesta musiknoter är pseudotonala (en grundton plus övertoner).

Frekvensvägningar

Det mänskliga örat är inte lika känsligt för alla frekvenser — långt ifrån. En ton på 60 dB vid 1 kHz låter mycket högre än en ton på 60 dB vid 50 Hz, eftersom örat är som mest känsligt i mitten och mycket mindre i basen (och något mindre över 5 kHz).

En mätmikrofon är till sin design platt: dess elektriska utgång är proportionell mot det akustiska trycket över hela det hörbara området. Den platthet är rätt utgångspunkt, men betyder att den råa mätningen inte representerar hur människan upplever ljud. För att fylla det gapet lägger bullermätare på ett frekvensvägningsfilter före nivåberäkningen.

Fyra vägningar är standardiserade i IEC 61672‑1, historiskt namngivna med bokstäver:

A-vägning

Närmar sig inversen av isofonkurvan vid 40 fon. Dämpar starkt basen (cirka −30 dB vid 50 Hz, −40 dB vid 20 Hz) och lätt över 6 kHz; blir nästan platt i 1 – 5 kHz, där örat är mest känsligt. Används för nästan allt arbetsmiljö- och miljöbuller (NIOSH, OSHA, WHO, ISO 1996, EU 2003/10/EG, AFS 2005:16).

Den matematiska formen är ett analogt filter med 4 poler och 4 nollor:

R_A(f) = (12194² × f⁴) / [ (f² + 20,6²) × √((f² + 107,7²)(f² + 737,9²)) × (f² + 12194²) ]
A(f) = 20 × log10( R_A(f) ) + 2,00 dB

Offsetn +2,00 dB normaliserar A till 0 dB vid 1 kHz.

C-vägning

Mycket plattare än A. Dämpar bara vid det hörbara områdets ändar (cirka −3 dB vid 31,5 Hz och 8 kHz; cirka −0,2 dB vid 50 Hz). Används vid toppmätningar (där topparnas verkliga energi spelar mer roll än upplevd ljudstyrka), vid basrika källor som konserter, subwoofers och åska, och historiskt vid höga nivåer, där örats frekvensgång ligger närmare en 40 – 100-fon-kurva än 40-fon-kurvan A approximerar.

B- och D-vägning

B var en mellanvägning för medelnivåer (50 – 60 fon). D var specifik för flygbuller. Moderna normer har dragit tillbaka dem; man stöter sällan på dem.

Z-vägning

Noll-vägning — platt gång från 10 Hz till 20 kHz. Används i forskning och instrumentverifiering. Ersätter äldre ”linjär” eller ”ovägd”, som inte var konsekvent mellan tillverkare.

Vid tvekan: A. Mäter du något som domineras av basen, ange även C; skillnaden mellan A och C är i sig diagnostisk för spektralinnehållet.

Isofonkurvor

Människans frekvensberoende är inte en enda kurva — den varierar med nivån. Vid låg SPL är du föga känslig för bas; vid hög SPL plattar kurvan ut.

Klassiska experimentdata kommer från Fletcher och Munson (1933), med moderna revisioner standardiserade i ISO 226:2003. Båda ger en familj kurvor, var och en märkt med ett värde i fon, där fon är SPL för en 1-kHz-ton som upplevs lika hög som testtonen. 40-fon-kurvan visar alltså vilken SPL som vid varje frekvens behövs för att låta lika högt som en 40 dB SPL-ton vid 1 kHz.

Några praktiska följder:

A-vägning modellerar 40-fon-kurvan, så den är mer exakt vid medelnivåer (40 – 60 dB SPL). Vid höga nivåer (> 90 dB SPL) underskattar A basen mot örats faktiska respons.
Fon är en enhet för ljudnivå, inte ljudstyrka i sig.
Sone är en enhet för upplevd ljudstyrka, definierad så att en fördubbling av sones motsvarar fördubblad upplevd ljudstyrka. 1 sone = 40 fon. 2 sone = 50 fon (regeln ”+10 fon = dubbelt så högt”).

Tidsintegration

En mikrofon levererar tusentals gånger per sekund ett momentanvärde av trycket. Att rapportera ett enstaka sampel som ”nivån” är meningslöst — bullermätare beräknar ett tidsvägt RMS över en vald integrationskonstant:

p_rms(t) = sqrt( (1/τ) × integral( p²(s) × e^(-(t-s)/τ) ) ds )

Tidskonstanten τ styr reaktionshastigheten:

Fast (F) — τ = 125 ms. Standard för arbetsmiljö- och miljömätningar.
Slow (S) — τ = 1000 ms. För stabilt omgivningsbuller.
Impulse (I) — τ_anslag = 35 ms, τ_fall = 1500 ms. Fångar korta transienter (skott, hammarslag).

För starkt tidsvarierande buller flimrar den tidsvägda SPL. De flesta normer använder i stället kontinuerlig ekvivalent nivå (Leq eller LAeq för A) — den konstanta SPL som ger samma totala akustiska energi som den faktiskt varierande signalen:

LAeq,T = 10 × log10( (1/T) × integral( 10^(LA(t)/10) ) dt )

Leq är energimässigt ekvivalent, summerbar i tid, och grunden för varje modern arbetsmiljö- eller miljöbullernorm. För grannskapsbuller ser man ibland andra statistiska deskriptorer:

L10, L50, L90 — den nivå som överskrids 10 %, 50 %, 90 % av mättiden. L10 är en ”typisk topp”; L90 en ”bakgrund”.
Lden — viktat 24-timmarsmedel för EU:s bullerkartor. Kväll +5 dB, natt +10 dB. I Sverige används det bl.a. i kommunala bullerkartläggningar enligt förordningen (2004:675) om omgivningsbuller.
Lmax, Lpeak — maxima per händelse. Lmax är tidsvägt; Lpeak är den momentana ovägda toppen.

FFT och spektrumanalys

En tryckvågform i tidsdomänen kan via snabb fouriertransform (FFT) överföras till frekvensdomänen. FFT tar ett fönster med sampel och ger ett komplext spektrum med amplitud och fas per frekvensbin.

Några egenskaper att känna till:

Bin-upplösning = sampelfrekvens / FFT-storlek. 48 kHz med 2048-punkts FFT ger 23,4 Hz per bin — fint för musik och tal, grovt för lågfrekvent analys där 1 Hz-upplösning kan behövas.
Fönsterfunktion — multiplicering av tidssamplen med ett fönster (Hann, Hamming, Blackman, Kaiser) före FFT minskar spektralt läckage på bekostnad av bredare huvudlober. Vår visualizer använder Hann-fönster.
Tid–frekvens-osäkerhet. Bredare FFT-fönster ger bättre frekvensupplösning men sämre tidsupplösning. Båda samtidigt går inte — Heisenberg, tillämpat på akustik.

För arbetsmiljö- och miljömätningar är tersbandsanalys mer användbar än smalbandig FFT. En tersbandsanalysator grupperar FFT-bins i perceptuellt meningsfulla band (det örat ungefär löser upp), vilket gör spektrumet läsbart och jämförbart med standardklassningskurvor (NC, RC, NR).

Bullermätarens visualizer visar en smalbands-FFT som diagnostiskt verktyg — tonala källor uppträder som isolerade toppar. För formell frekvensanalys: använd en klass 2-SLM med integrerade tersband.

Tillbaka till mätaren

Varje siffra från bullermätaren är resultatet av:

Provtagning av lufttrycket vid mikrofonen (kalibreringssidan tar upp vad som kan gå fel där).
A-vägning på den digitala signalen (eller C eller Z, beroende på inställning).
Kvadrering, tidsvägning (Fast / Slow / Impulse), kvadratrot för ett RMS-tryck.
20 × log10 av förhållandet till 20 µPa.
Tillägg av användarens calibration offset.

Att känna kedjan ändrar inte avläsningarna, men förklarar varför två mätare kan skilja sig: olika mikrofonkalibrering, olika vägningar, olika integrationstider, olika referensvärden. När siffrorna inte stämmer ligger svaret nästan alltid någonstans i kedjan.

För praktisk tolkning av avläsningar — vad som räknas som högt, vad som är säkert, vilka regler som gäller — se jämförelsetabellen, hörselsidan och arbetssidan. För definitioner av begrepp är ordlistan tillbakaindexet till denna sida.

Open the decibel meter