علم الصوت: الديسيبلات والتردّدات والسمع موضَّحة
كلّ قراءة على مقياس ديسيبل هي النهاية المرئية لسلسلة من الفيزياء ومعالجة الإشارة وعلم النفس الصوتي. فهم هذه السلسلة يجعل القراءات مفيدة — تتوقّف عن سؤال «هل 90 dB عالٍ؟» وتبدأ بالأسئلة الأنفع: 90 dB مقارنةً بأيّ مرجع، عبر أيّ مرشّح وزن، مكاملة على أيّ نافذة زمنية. تشرح هذه الصفحة فيزياء موجات الصوت، رياضيّات مقياس الديسيبل، أوزان التردّد المعيارية الأربعة، منحنيات الصوت المتساوي، التكامل الزمني، وتحليل طيف FFT. في النهاية ينبغي أن تكون قادراً على قراءة أيّ رقم ضوضاء منشور ومعرفة ماذا يعني وما لا يعنيه بالضبط.
هذه أطول صفحة تقنية في الموقع. إن كنت هنا للتعلّم، اقرأ من البداية إلى النهاية. إن كنت هنا للبحث عن مفهوم محدّد، يربط المعجم بالقسم المناسب من هذه الصفحة لكلّ مصطلح.
الصوت موجة ضغط
الصوت موجة طولية لتقلّبات الضغط تنتشر عبر وسط مرن — عادةً الهواء. مصدر مهتزّ يضغط الهواء أمامه، ثم يخفّفه عند تراجعه، وهذا النمط من الضغط والتخفيف يتحرّك للخارج بسرعة الصوت (نحو 343 m/s في الهواء عند 20 °C، أبطأ في الهواء البارد، أسرع في الدافئ أو الأكثف كالماء).
الكمّية الفيزيائية التي يستجيب لها الميكروفون هي الضغط — الفرق بين الضغط المحلّي اللحظي للهواء والضغط الجوّي الثابت. الضغط الجوّي حوالى 101,325 Pa (101 kPa)؛ أهدأ صوت يميّزه ذو سمع شابّ سليم — عتبة السمع عند 1 kHz — هو تقلّب ضغط حوالى 20 ميكروباسكال (20 µPa)، أو 20 × 10⁻⁶ Pa. عتبة الألم حوالى 20 Pa، أكبر بمليون مرّة.
نسبة المليون هذه في الضغط تحفّز مقياس الديسيبل اللوغاريتمي. العمل بـ Pa خطّي على هذا المدى يعطي أرقاماً صعبة (قارن 0.00002 بـ 20). الضغط اللوغاريتمي ينتج 0 dB إلى 120 dB، أسهل بكثير في الكتابة والتفكير.
لموجة الضغط ثلاث وصّافات أساسية:
- السعة — مقدار تقلّب الضغط. تترابط مع الصوت بلاخطّيات قويّة (انظر الصوت المتساوي أدناه).
- التردّد — عدد دورات الضغط/التخفيف في الثانية، بالـ هرتز (Hz). تترابط مع الطبقة، أيضاً بلاخطّيات.
- الطور — موقع الموجة الحالي في الدورة. غير مهمّ في الغالب لقياسات المستوى، مهمّ للتداخل وإعدادات الميكروفونات المتعدّدة.
لنغمة جيبية نقيّة، تصف هذه الأرقام الثلاثة الإشارة كاملةً. الأصوات الحقيقية تقريباً ليست نغمات نقيّة — إنّها مجاميع لمكوّنات كثيرة في تردّدات مختلفة، لكلّ منها سعتها وطورها، تتغيّر باستمرار في الزمن.
مقياس الديسيبل
الديسيبل ليس وحدة — هو نسبة لوغاريتمية بين كمّيتين تُجعل رقماً قابلاً للاستخدام بالإحالة إلى مقام ثابت. لمستوى ضغط الصوت (SPL)، المرجع المعياري 20 µPa. عند ضغط مقيس p يكون SPL بالديسيبل:
L_p = 20 × log10( p / p_0 ) حيث p_0 = 20 µPa
العامل 20 (لا 10) لأنّ الضغط متناسب مع جذر الشدّة، والديسيبل نسبة قدرة. للشدّة الصوتية:
L_I = 10 × log10( I / I_0 ) حيث I_0 = 1 pW/m²
في الحقل الحرّ، تعطي الصيغتان الرقم نفسه، لذا يستخدمهما أغلب الناس بالتبادل، و«dB» جواب ذو معنى دون تحديد.
ثلاث قواعد إبهام مباشرة من الرياضيات:
- +3 dB يضاعف الطاقة الصوتية. مصدران غير متماسكين متطابقان (60 dB كلّ منهما) يجمعان 63 dB، لا 66 dB. ثلاثة مصادر متطابقة تجمع 60 + 10 log10(3) ≈ 64.8 dB.
- +10 dB ≈ ضعف الصوت للمستمع البشري. الزيادة العشريّة في الشدّة تتقلّص إلى تقريباً ضعف الصوت المُدرَك بفعل لاخطّية السمع.
- +6 dB يضاعف الضغط ويضيف ×4 شدّة. هذا مهمّ للمسافة: مصدر نقطي في حقل حرّ، تضاعف المسافة، يهبط SPL بـ 6 dB.
لمقياس الديسيبل نسخ تربك المبتدئين:
- dB SPL — مقياس الضغط الموصوف أعلاه. الافتراضي للقياسات الصوتية.
- dB FS (full scale) — في الصوت الرقمي. 0 dB FS هو القيمة القصوى للعيّنة الرقمية المُمكنة؛ ما عدا ذلك سالب. لا يقارن مباشرةً بـ dB SPL دون معايرة مرجعية.
- dB SWL (sound power level) — الطاقة المطلقة المُشعّة من مصدر، بصرف النظر عن مكان القياس. تستخدم لتصنيفات المعدّات.
- dBA / dBC / dBZ — الوزن A أو C أو Z مطبَّق على قياس dB SPL. حدّد دائماً الوزن مع الرقم.
التردّد والطبقة
تستجيب الأذن البشرية لتقلّبات الضغط من حوالى 20 Hz في الطرف المنخفض إلى حوالى 20 kHz في الطرف العالي، مع تراجع الحدّ الأعلى مع العمر (شخص اعتيادي بعمر 60 يسمع حتى نحو 12 kHz). تحت 20 Hz تحت سمعي (يُحسّ أكثر ممّا يُسمَع)؛ فوق 20 kHz فوق سمعي (صفّارة كلب نحو 25 kHz؛ موجات فوق صوتية طبيّة في نطاق ميغاهرتز).
تستخدم مقاسان لقياس فترات التردّد:
- الأوكتاف — تضاعف التردّد. 100 Hz – 200 Hz أوكتاف؛ 200 Hz – 400 Hz التالي. النطاق المسموع نحو 10 أوكتافات.
- ثلث الأوكتاف — ثلاث حزم لكلّ أوكتاف، تقليدية في القياسات الصوتية لأنّها تقارب دقّة تردّد الأذن. تحدّد ISO 266 التردّدات المركزية المعيارية (...100, 125, 160, 200, 250, 315, 400...).
للأصوات الواقعية محتوى عريض الطيف: مكنسة طاقة موزّعة على حزم تردّد كثيرة؛ شوكة رنّانة مركّزة على تردّد واحد. أغلب ضوضاء البيئة عريضة الطيف؛ أغلب النوتات الموسيقية شبه نغمية (أساس زائد توافقيات).
أوزان التردّد
الأذن البشرية ليست متساوية الحساسية لكل التردّدات — أبعد ما تكون. نغمة 60 dB عند 1 kHz تبدو أعلى بوضوح من نغمة 60 dB عند 50 Hz، لأنّ الأذن أكثر حساسية في النطاق المتوسّط وأقلّ بكثير في الطرف المنخفض (وأقلّ نسبيّاً فوق ~5 kHz).
ميكروفون القياس بحكم التصميم مستوٍ — مخرجه الكهربائي متناسب مع الضغط الصوتي عبر النطاق المسموع. هذا الاستواء نقطة بدء صحيحة، لكنّه يعني أنّ القياس الخامّ لا يعكس كيف يختبر المستمع البشري الصوت. لجسر هذه الفجوة، تطبّق مقاييس مستوى الصوت مرشّح وزن تردّد قبل حساب المستوى.
أربعة أوزان معيارية في IEC 61672‑1، مسمّاة تاريخياً بحرف:
وزن A
يقارب عكس منحنى الصوت المتساوي 40 فون. يخفّض بقوّة التردّدات تحت 500 Hz (نحو −30 dB عند 50 Hz، −40 dB عند 20 Hz) وقليلاً فوق 6 kHz؛ شبه مستوٍ في 1 – 5 kHz حيث الأذن أكثر حساسية. مستخدم في كلّ ضوضاء مهنية وبيئية تقريباً (NIOSH, OSHA, WHO, ISO 1996, EU 2003/10).
الصيغة الرياضية مرشّح تشبيهي بـ 4 أقطاب و4 أصفار:
R_A(f) = (12194² × f⁴) / [ (f² + 20.6²) × √((f² + 107.7²)(f² + 737.9²)) × (f² + 12194²) ]
A(f) = 20 × log10( R_A(f) ) + 2.00 dB
إزاحة +2.00 dB تطبّع وزن A على 0 dB عند 1 kHz.
وزن C
أكثر استواءً من A. يخفّض فقط في طرفَي النطاق المسموع (نحو −3 dB عند 31.5 Hz وعند 8 kHz؛ نحو −0.2 dB عند 50 Hz). يستخدم لـ قياسات الذروة (حيث طاقة الذروة الفعلية تهمّ أكثر من الصوت المُدرَك)، لمصادر ذات تردّد منخفض كالحفلات والسبووفر والرعد، وتاريخياً للأصوات العالية حيث استجابة تردّد الأذن تقترب من منحنى 40 – 100 فون أكثر من 40 فون الذي يقاربه A.
وزنا B وD
كان B وزن مستوى وسيط، للأصوات المعتدلة (50 – 60 فون). كان D خاصّاً بضوضاء الطائرات. أُلغي كلاهما من المعايير الحديثة وتلقاهما نادراً عملياً.
وزن Z
وزن صفر — استجابة مستوية عبر 10 Hz إلى 20 kHz. يستخدم للأبحاث والتحقّق من الجهاز. حلّ محلّ مصطلح «خطّي» أو «دون وزن» الأقدم الذي لم يكن متّسقاً بين المصنّعين.
في الشكّ، استخدم وزن A. عند قياس ما يهيمن عليه الباس، أبلغ أيضاً بـ C؛ الفجوة بين A وC تشخيصية بحدّ ذاتها للمحتوى الطيفي.
منحنيات الصوت المتساوي
اعتماد التردّد للسمع البشري ليس منحنى واحداً — يتغيّر مع المستوى. عند SPL منخفضة، أنت غير حسّاس جدّاً للتردّدات المنخفضة؛ عند SPL عالية، يستوي المنحنى.
البيانات التجريبية الكلاسيكية فلتشر ومانسون 1933، مع مراجعات حديثة معيارية كـ ISO 226:2003. كلاهما ينتجان عائلة من المنحنيات، كلّ واحد بقيمة فون، حيث الفون هو SPL لنغمة 1 kHz مدركَة بنفس صوت نغمة الاختبار. منحنى 40 فون يظهر SPL المطلوب عند كل تردّد ليبدو بنفس صوت نغمة 40 dB SPL عند 1 kHz.
بضع تداعيات عملية:
- وزن A يصمّم منحنى 40 فون، لذا هو الأدقّ لمستويات الاستماع المعتدلة (40 – 60 dB SPL). على المستويات العالية (> 90 dB SPL)، يبخس وزن A التردّدات المنخفضة بالنسبة لما تستجيب له الأذن فعلاً.
- الفون وحدة مستوى صوت، لا الصوت نفسه.
- السون وحدة صوت مُدرَك، معرَّفة بحيث يقابل تضاعف السون تضاعف الصوت المُدرَك. 1 سون = 40 فون. 2 سون = 50 فون (قاعدة +10 فون = ×2 صوت).
التكامل الزمني
يبلّغ ميكروفون قيمة ضغط لحظية آلاف المرّات في الثانية. الإبلاغ عن أيّ عيّنة واحدة كـ «المستوى» غير مفيد — بدلاً من ذلك، تحسب مقاييس مستوى الصوت RMS موزون زمنياً على وقت تكامل مختار:
p_rms(t) = sqrt( (1/τ) × integral( p²(s) × e^(-(t-s)/τ) ) ds )
ثابت الزمن τ يحدّد سرعة الاستجابة:
- Fast (F) —
τ = 125 ms. الافتراضي للقياسات البيئية والمهنية. - Slow (S) —
τ = 1000 ms. لضوضاء محيط ثابتة. - Impulse (I) —
τ_attack = 35 ms,τ_decay = 1500 ms. يلتقط نبضات قصيرة (طلقات، ضرب مطرقة).
للضوضاء التي تتغيّر بشكل ملحوظ في الزمن، يهتزّ SPL الموزون زمنياً. أغلب المعايير التنظيمية تستخدم بدلاً من ذلك المستوى المتواصل المكافئ (Leq أو LAeq لـ A) — SPL ثابت يعطي نفس الطاقة الصوتية الإجمالية كالإشارة المتغيّرة الفعلية:
LAeq,T = 10 × log10( (1/T) × integral( 10^(LA(t)/10) ) dt )
Leq مكافئ طاقياً، تجميعي عبر الزمن، وأساس كلّ معيار حديث للضوضاء المهنية. وصّافات إحصائية أخرى تستخدم أحياناً لضوضاء المجتمع:
- L10, L50, L90 — المستوى المتجاوز 10 % و50 % و90 % من فترة القياس. L10 «ذروة اعتيادية»؛ L90 مستوى «خلفية».
- Lden — متوسّط موزون نهار-مساء-ليل يستخدم في رسم ضوضاء المجتمع في الاتحاد الأوروبي. يعاقب المستويات المسائية بـ +5 dB والليلية بـ +10 dB.
- Lmax, Lpeak — أقصى للحدث الواحد. Lmax هو أعلى مستوى موزون زمنياً خلال القياس (باستخدام Fast وSlow وImpulse). Lpeak هو أعلى عيّنة لحظية دون وزن.
FFT وتحليل الطيف
يمكن تحويل موجة ضغط في النطاق الزمني إلى النطاق الترددي عبر التحويل السريع لفورييه (FFT). يأخذ FFT نافذة من عيّنات الصوت وينتج طيفاً مركّباً يظهر سعة وطور كل سلّة تردّد ضمن النافذة.
بضع خصائص لـ FFT يجب أن يعرفها كل مستخدم:
- دقّة السلّة = sample_rate / FFT_size. معدّل عيّنات 48 kHz بـ FFT 2048 نقطة يعطي 23.4 Hz لكل سلّة — دقيق للموسيقى والكلام، خشن لتحليل التردّد المنخفض حيث قد يلزم 1 Hz.
- دالة النافذة — ضرب العيّنات الزمنية بنافذة (Hann, Hamming, Blackman, Kaiser) قبل FFT يقلّل التسرّب الطيفي على حساب فصوص رئيسية أعرض. يستخدم visualizer عندنا نافذة Hann.
- عدم اليقين زمن-تردّد. نوافذ FFT أكبر تعطي دقّة تردّد أنعم لكن دقّة زمن أخشن. لا سبيل إلى الاثنين — Heisenberg، مطبَّقاً على الصوتيّات.
للقياسات البيئية والمهنية، تحليل ثلث الأوكتاف أنفع من FFT ضيّق الحزمة. محلّل ثلث الأوكتاف يجمّع سلّات FFT في حزم ذات معنى إدراكي (الحزم نفسها التي تُحلّها الأذن تقريباً)، ما يجعل الطيف الناتج قابلاً للقراءة وقابلاً للمقارنة بمنحنيات تقييم ضوضاء معيارية (NC, RC, NR).
يعرض visualizer في مقياسنا FFT ضيّق الحزمة لأغراض التشخيص — تقفز المصادر النغميّة كذرى مفردة. للتحليل الترددي الرسمي، استخدم SLM صنف 2 بحزم ثلث أوكتاف مدمجة.
ربطها بالمقياس
كلّ رقم على مقياس الديسيبل نتيجة:
- أخذ عيّنة من ضغط الهواء عند الميكروفون (تغطّي صفحة المعايرة ما يمكن أن يخطئ هنا).
- تطبيق وزن A على الإشارة الرقمية (أو C، أو Z، حسب الإعدادات).
- التربيع، الوزن الزمني (Fast / Slow / Impulse)، وأخذ الجذر لإنتاج RMS للضغط.
- أخذ 20 × log10 للنسبة إلى 20 µPa.
- إضافة إزاحة معايرة المستخدم.
معرفة السلسلة لا تغيّر القراءات، لكنّها تخبر لماذا قد يختلف مقياسان: معايرات ميكروفون مختلفة، أوزان مختلفة، أوقات تكامل مختلفة، قيم مرجعية مختلفة. حين لا تتطابق الأرقام، الجواب دائماً تقريباً في مكان ما من هذه السلسلة.
للتفسير العملي للقراءات — ما يُعدّ عالياً، ما آمن، ما اللوائح المنطبقة — انظر جدول المقارنة وصفحة صحة السمع وصفحة معايير العمل. لتعريفات المصطلحات، المعجم فهرسة عودة إلى هذه الصفحة.