صدای مونو و استریو چیست و چه تفاوتی دارند؟

2151125076

فهرست عناوین

در دنیای صدا، فرمت‌های مختلفی برای ضبط و پخش وجود دارد؛ از صدای مونو (Mono) تک‌کاناله گرفته تا صدای استریو (Stereo) دوکاناله. علاوه بر این‌ها، فناوری‌های پیشرفته‌تری نیز توسعه یافته‌اند که تجربهٔ شنیداری غوطه‌ورانه‌تری ایجاد می‌کنند؛ از جمله صدای فراگیر یا Surround Sound، صدای سه‌بعدی (3D Audio) و صدای فضایی (Spatial Audio).

در این مقاله با زبانی ساده به معرفی هر کدام از این مفاهیم، تفاوت‌ها و مزایای آن‌ها و نمونه‌های کاربردی‌شان می‌پردازیم تا تصویر روشنی از این اصطلاحات ارائه شود.

صدای مونو (Mono) چیست؟

صدای مونو به معنی تک‌کاناله بودن صدا است؛ یعنی تمامی اطلاعات صوتی (سخن، موسیقی، افکت‌ها و غیره) در یک کانال ترکیب شده و از طریق همان یک کانال پخش می‌شوند. حتی اگر چند بلندگو برای پخش مونو به‌کار رود، همهٔ آن‌ها یک سیگنال یکسان را پخش می‌کنند.

حاصل این است که در حالت مونو، صدا از یک نقطه یا جهت ثابت به گوش می‌رسد و فاقد گستردگی و عمق استریویی.

به عبارت دیگر، شنونده تفاوتی بین چپ و راست احساس نمی‌کند و تمام صداها انگار از مرکز واحدی پخش می‌شوند. قبل از ابداع صدای استریو، تمامی سیستم‌های صوتی به صورت مونو بودند و تنها یک منبع صوتی متمرکز ارائه می‌دادند.

کاربردهای صدای مونو

با وجود رایج شدن فرمت‌های چندکاناله، صدای مونو همچنان در موارد خاصی استفاده می‌شود:

رادیو و پادکست: بسیاری از برنامه‌های رادیویی AM (به‌ویژه برنامه‌های گفتگو‌محور) و حتی پادکست‌ها به صورت مونو ضبط و پخش می‌شوند. مونو برای محتوای کلامی مناسب است و سادگی آن باعث می‌شود روی وضوح گفتار تمرکز شود.

سیستم‌های اطلاع‌رسانی عمومی: در سیستم‌های بلندگوی اعلان عمومی (مانند سیستم صوتی ایستگاه‌های قطار، فرودگاه یا سالن‌های همایش) معمولاً از صدای مونو استفاده می‌شود. علت این است که با تک‌کاناله بودن صدا، پوشش یکنواخت در فضای بزرگ به‌دست می‌آید و همهٔ حضار صدای یکسانی می‌شوند. اگر چنین سیستم‌هایی استریو بودند، ممکن بود افراد بسته به نزدیکی به بلندگوی چپ یا راست، بخش‌هایی از پیام را کمتر یا بیشتر بشنوند. بنابراین مونو تضمین می‌کند همه «یک چیز» بشنوند نه اینکه هر کس بخشی از صدا را واضح‌تر دریافت کند.

اجرای زنده با بلندگوهای متعدد: در برخی کلاب‌ها یا سالن‌های کنسرت نیز خروجی صدا را عمداً به شکل مونو تنظیم می‌کنند تا موسیقی (خصوصاً صداهای بم و بیس قوی) در همه نقاط سالن با قدرت و ترکیب یکسان پخش شود. این کار از تداخل یا پراکندگی نامتوازن صدا در محیط جلوگیری می‌کند.

ضبط‌های تک‌صدایی و تاریخی: مونو همچنان برای ضبط صدای گفت‌وگو، مصاحبه‌ها یا هر محتوایی با یک منبع صوتی انتخاب مناسبی است. همچنین برخی آثار موسیقی قدیمی (مثلاً آلبوم‌های اولیه بیتلز یا باب دیلن) در نسخه‌های مونو ضبط شده‌اند. این نسخه‌ها به خاطر ویژگی نوستالژیک و ترکیب خاص صدا هنوز توسط برخی شنوندگان ترجیح داده می‌شوند.

صدای استریو (Stereo) چیست؟

صدای استریو به معنای پخش صدا از دو کانال مجزای چپ و راست است. در یک ضبط استریو، صداها به صورت دو سیگنال جداگانه در کانال چپ (L) و راست (R) ثبت می‌شوند و در پخش، هر بلندگو یکی از این کانال‌ها را اجرا می‌کند. نتیجهٔ این کار ایجاد میدان صدایی وسیع‌تر و عمیق‌تر نسبت به حالت مونو است.

به واسطهٔ وجود دو کانال، مغز انسان می‌تواند بر اساس تفاوت‌های جزئی میان صدای دریافتی در گوش چپ و راست، محل قرارگیری و فاصلهٔ منابع صوتی را تشخیص دهد. برای مثال، اگر یک صدا در هر دو کانال به یک اندازه پخش شود، شنونده احساس می‌کند آن صدا از مرکز (بین دو بلندگو) می‌آید که به آن «مرکز خیالی» در استریو می‌گویند.

از سوی دیگر اگر صدای گیتار فقط در کانال چپ و صدای پیانو در کانال راست میکس شده باشد، ما گیتار را از سمت چپ و پیانو را از سمت راست می‌شنویم و یک صحنهٔ صوتی گسترده شکل می‌گیرد.

امروزه صدای استریو فرمت استاندارد اکثر رسانه‌ها است. تقریباً همهٔ موسیقی‌های مدرن، آلبوم‌های استودیویی، برنامه‌های تلویزیونی و سرویس‌های استریم آنلاین (مانند Spotify و YouTube) محتوای صوتی را به صورت استریو منتشر می‌کنند.

اکثر کاربران برای شنیدن استریو به یک جفت بلندگوی دوکاناله یا هدفون استریو دسترسی دارند و همین تجهیزات صوتی ساده می‌تواند تجربه‌ای بسیار غنی‌تر از مونو فراهم کند. تنها نکته این است که برای بهترین بهره‌گیری از جلوهٔ استریو، موقعیت قرارگیری شنونده مهم است. سیستم استریو طوری طراحی شده که اگر شنونده دقیقاً در وسط و مقابل دو بلندگو بنشیند (در نقطهٔ شیرین)، تفکیک جهت‌ها و ترکیب صداها بهینه خواهد بود. در مقابل، اگر دور از مرکز یا نزدیک به یکی از بلندگوها باشید، تعادل استریو به‌هم می‌خورد. به همین دلیل در محیط‌هایی که افراد در حال حرکت‌اند یا پراکنده ایستاده‌اند (مثلاً یک مهمانی در فضای باز)، استریو کارایی کمتری دارد و در آن موارد صدای مونو ترجیح داده می‌شود.

مقایسهٔ صدای مونو و استریو

هر دو سیستم مونو و استریو برای پخش صدا به‌کار می‌روند، اما تفاوت‌های اساسی‌ای با هم دارند که بر کاربرد مناسب‌شان تأثیر می‌گذارد:

تعداد کانال: همان‌طور که گفته شد، صدای مونو تنها یک کانال صوتی دارد، در حالی که صدای استریو از دو کانال مجزا (چپ و راست) استفاده می‌کند.

میدان و تصویر صوتی: در مونو، همهٔ صداها با هم ترکیب شده و از یک جهت واحد شنیده می‌شوند که میدانی باریک و متمرکز ایجاد می‌کند. اما در استریو صدا حالت پهنه دوبُعدی پیدا می‌کند؛ صداهای مختلف می‌توانند در طیف بین چپ تا راست پراکنده شوند و یک تصویر استریویی وسیع با عمق و لایه‌های بیشتر شکل می‌گیرد. به بیان ساده، استریو به صدا بُعد می‌دهد در حالی که مونو همه چیز را در یک نقطه خلاصه می‌کند.

جزئیات و کیفیت تجربه: موسیقی و محتوای چندآوایی در استریو با وضوح و جزئیات کامل‌تری به گوش می‌رسند. ترکیب دو کانال در استریو باعث می‌شود صدا غنی‌تر و طبیعی‌تر احساس شود و عناصر مختلف (آواز، سازها و غیره) جدا از هم قابل تشخیص باشند. در مقابل، در مونو ممکن است برخی ظرافت‌های میکس‌شده در استریو از دست بروند چون همه صداها روی هم می‌نشینند.

پوشش‌دهی فضا: صدای مونو از هر نقطه‌ای به شکل یکسان شنیده می‌شود؛ یعنی اگر شنونده جایش را تغییر دهد، تغییری در بالانس صدا احساس نخواهد کرد. این ویژگی در فضاهای بزرگ یا شرایطی که حضار در حرکت‌اند بسیار مفید است (مثلاً در یک همایش یا محیط بیرونی با بلندگوی قابل‌حمل). در مقابل، صدای استریو وابسته به موقعیت شنونده است و برای دریافت صحیح تفکیک کانال‌ها، فرد باید در محدودهٔ مشخصی روبروی بلندگوها قرار گیرد. اگر فاصله یا زاویهٔ شنونده نسبت به بلندگوها مناسب نباشد، ممکن است تعادل چپ/راست به خوبی دریافت نشود.

صدای فراگیر (Surround Sound) چیست؟

فراتر از استریو، سیستم‌های چندکانالهٔ پیشرفته‌تری طراحی شده‌اند که به صدای فراگیر یا Surround مشهورند.

در یک سیستم Surround از بلندگوهای متعدد در اطراف شنونده استفاده می‌شود تا صدا از جهت‌های مختلف وی را احاطه کند و حس حضور در صحنه را چندین برابر افزایش دهد. نخستین کاربرد صدای فراگیر در سینماها بود. در سینمای کلاسیک قبل از Surround، معمولاً تنها سه بلندگو در جلوی سالن (چپ، راست و مرکز) وجود داشت، اما با معرفی Surround بلندگوهای جانبی و عقبی اضافه شدند تا صدا بتواند از کنار و پشت سر تماشاگر نیز به گوش برسد. به این ترتیب هر جهت افقی در محیط می‌تواند منبع صوتی داشته باشد؛ برای مثال صدای بارش باران را می‌توان طوری پخش کرد که گویی از پشت سر و اطراف شنیده می‌شود یا صدای تشویق تماشاچیان از تمام جهت‌ها شما را در بر بگیرد.

یک سیستم Surround استاندارد شامل چندین کانال مجزاست. به عنوان نمونه، استاندارد رایج ۵٫۱ کاناله از ۶ بلندگو بهره می‌برد: سه بلندگو در جلو (چپ، مرکز، راست)، دو بلندگوی محیطی در طرفین یا عقب (چپ و راست) و یک بلندگوی ویژهٔ فرکانس‌های بم (ساب‌ووفر).

در این چیدمان، صدای مرکز (مانند دیالوگ‌ها) از جلو وسط، صدای استریو موسیقی و جلوه‌ها از بلندگوهای چپ/راست جلو، و صداهای محیطی (مانند اثرات صوتی محیط یا صدای تماشاگران) از بلندگوهای عقب چپ/راست پخش می‌شوند. فرکانس‌های بم نیز توسط ساب‌ووفر (۰٫۱ کانال) تأمین می‌گردد. نسخهٔ پیشرفته‌تر، استاندارد ۷٫۱ کاناله است که دو بلندگوی جانبی اضافی نیز دارد (علاوه بر ۵٫۱)، تا پوشش صدای محیط در پهنای سالن کامل‌تر شود و تفکیک جهت‌ها دقیق‌تر گردد.

با یک چینش صحیح Surround، مهندسان صدا می‌توانند هر صدایی را به بلندگوی متناسب با موقعیت آن در صحنه بفرستند و یک میدان صوتی دور تا دور خلق کنند.

برای مثال، هنگام تماشای یک فیلم ممکن است صدای یک هواپیما را بشنوید که از پشتِ سر به تدریج به سمت جلوی شما حرکت می‌کند؛ این دقیقاً با حرکت هواپیما روی پرده هماهنگ است و به لطف بلندگوهای فراگیر، گذر صدا از عقب به جلو شبیه‌سازی می‌شود. چنین افکتی در استریوی معمولی امکان‌پذیر نبود، چون استریو فقط چپ و راست را پوشش می‌دهد و صدا از پشت سر شنونده نمی‌آید.

کاربرد صدای Surround: صدای فراگیر بیشترین کاربرد را در سالن‌های سینما و سینمای خانگی دارد که در آن‌ها فضای کافی برای چیدمان بلندگوهای متعدد وجود دارد. تماشای یک فیلم با صدای ۵٫۱ یا ۷٫۱ در یک اتاق مجهز، تجربه‌ای نزدیک به سینما به‌دست می‌دهد و بیننده را در میانهٔ اتفاقات فیلم قرار می‌دهد. همچنین بازی‌های ویدئویی پیشرفته (روی کنسول‌ها یا رایانه‌های شخصی مجهز به سیستم صوتی چندکاناله) از Surround بهره می‌برند تا صداهای بازی (مثلاً جهت قدم پای دشمن یا انفجارها) واقع‌گرایانه از جهتی که در دنیای بازی رخ می‌دهند به گوش بازیکن برسند. البته پیاده‌سازی صدای Surround نیازمند سخت‌افزار و چیدمان دقیق بلندگوهاست و باید سیستم به‌درستی کالیبره شود تا صدای همهٔ کانال‌ها متعادل باشد. اما در صورت راه‌اندازی صحیح، خروجی کار یک صدای پرطنین و فراگیر است که تأثیر آن در ایجاد هیجان و غوطه‌ورسازی مخاطب بسیار چشم‌گیر است.

صدای سه‌بعدی چیست؟

اصطلاح «صدای سه‌بعدی» به طور کلی به فناوری‌ها و تکنیک‌هایی گفته می‌شود که توهم حضور صدا در یک فضای سه‌بعدی را برای شنونده ایجاد می‌کنند.

در صدای سه‌بعدی، برخلاف استریو یا Surround مرسوم که بیشتر بر صفحهٔ افقی دور شنونده تمرکز دارند، صدا می‌تواند از هر جهت در کرهٔ اطراف سر شنونده شنیده شود – از جلو و پشت گرفته تا بالا یا پایین سر. به بیان دیگر، 3D Audio تلاش می‌کند محیط صوتی را همان‌گونه که در واقعیت می‌شنویم شبیه‌سازی کند؛ یعنی صداها در تمامی زوایا (۳۶۰ درجه افقی به‌علاوهٔ بُعد عمودی) قابل درک باشند.

برای دستیابی به چنین تجربه‌ای، دو رویکرد کلی وجود دارد: یکی استفاده از بلندگوهای متعدد در اطراف و بالای سر شنونده (مثلاً سیستم‌های Surround پیشرفته همراه با بلندگوهای سقفی یا کانال‌های ارتفاع)، و دیگری بهره‌گیری از تکنیک‌های پردازش سیگنال که حتی با دو بلندگوی معمولی یا یک هدفون استریو نیز محیط ۳۶۰ درجه صوتی را شبیه‌سازی می‌کنند.

روش دوم بسیار رایج شده است زیرا نیاز به تجهیزات خاص چندبلندگویی ندارد. این فناوری بر مبنای خصوصیات شنوایی انسان کار می‌کند: مغز ما از سرنخ‌هایی مانند تفاوت زمان رسیدن صدا به هر گوش، تفاوت شدت صدا در دو گوش و تغییر طیف فرکانسی صدا به خاطر شکل سر و گوش، برای تشخیص جهت‌ها استفاده می‌کند. مهندسان صدا با استفاده از فیلترهای تابع انتقال مربوط به سر (HRTF) همین پدیده را شبیه‌سازی می‌کنند.

به عنوان مثال با اعمال یک سری فیلتر و تاخیر روی صدای استریو، می‌توان کاری کرد که حتی از طریق یک هدفون معمولی، صداها برای شنونده طوری به نظر برسند که انگار در فضای اطرافش (پشت سر یا بالای سر) تولید می‌شوند. این تکنیک‌ها عملاً مغز را فریب می‌دهند تا منبع صدا را در مکانی غیر از محل فیزیکی بلندگو تصور کند.

احتمالأ شما هم ویدیوهایی را دیده‌اید که توصیه می‌کنند «با هدفون گوش کنید» و سپس صداها طوری پخش می‌شوند که انگار دور سر شما می‌چرخند یا کسی در پشت سر شما صحبت می‌کند؛ این همان نمونه‌ای از صدای سه‌بعدی مبتنی بر HRTF است.

صدای فضایی (Spatial Audio) چیست؟

عبارت صدای فضایی به مجموعه‌ای از فناوری‌های نوین در حوزهٔ صوت گفته می‌شود که با انعطاف و دقت بیشتر، تجربهٔ صدای سه‌بعدی را امکان‌پذیر کرده‌اند. Spatial Audio در حقیقت نسل تکامل‌یافتهٔ صدای فراگیر سنتی است که علاوه بر توزیع صدا در سطح افقی اطراف شنونده، بُعد ارتفاع را نیز به صحنهٔ صوتی اضافه می‌کند و شنونده را در فضای صوتی سه‌بعدی کامل قرار می‌دهد. با صدای فضایی، شما می‌توانید صداهایی را از بالا یا پایین سر خود بشنوید، درست مانند دنیای واقعی که صداها در سه بعد به گوش ما می‌رسند. این فناوری با افزودن لایه‌های واقع‌گرایانه‌تر به صدا، شنونده را هرچه بیشتر درگیر محتوا می‌کند.

ویژگی متمایز Spatial Audio نسبت به Surroundهای قدیمی، نحوهٔ تولید و پخش صداست. در سیستم‌های Surround کلاسیک (مثلاً ۵٫۱ یا ۷٫۱)، صدا به تعدادی کانال ثابت (چند بلندگوی معین در جاهای مشخص) میکس می‌شود؛ در حالی که در Spatial Audio عموماً از رویکرد شی‌ء-محور (Object-Based Audio) استفاده می‌شود.

بدین صورت که هر صدای مجزا در میکس به عنوان یک «شی‌ء صوتی» تعریف می‌گردد و همراه با اطلاعات مکان خودش (مثلاً مختصات سه‌بعدی در یک فضای فرضی X,Y,Z) ذخیره می‌شود. سپس سیستم پخش (پلیر یا هدست) بر اساس چینش بلندگوهای موجود یا موقعیت سر شنونده، این اشیاء صوتی را در همان مختصات اعلام‌شده بازآفرینی می‌کند. برای مثال، فناوری Dolby Atmos یکی از معروف‌ترین پیاده‌سازی‌های صدای فضایی است که در آن به جای میکس کردن صدا فقط برای کانال‌های مشخص، صداها به صورت «اشیاء» حاوی اطلاعات موقعیت سه‌بعدی ضبط و میکس می‌شوند. یک ترک صوتی Dolby Atmos ممکن است حاوی ده‌ها شیء صوتی (مثلاً صدای باران، پرواز یک هلیکوپتر، صدای ماشین در خیابان) باشد که هر کدام مختصات خود را دارند.

دستگاه پخش‌کننده (چه یک سینمای خانگی با ۱۲ بلندگو یا یک هدفون ساده) با دانستن این اطلاعات مکانی و داشتن الگوریتم مناسب، تصمیم می‌گیرد هر صدا را چگونه به گوش شنونده برساند تا آن مکان را القا کند.

یکی دیگر از قابلیت‌های بسیار جالب در برخی سیستم‌های Spatial Audio، پشتیبانی از ردیابی سر (Head Tracking) است. این ویژگی بیشتر در هنگام استفاده از هدفون معنا پیدا می‌کند. در سیستم‌های مجهز به ردیابی سر – برای مثال Spatial Audio در ایرپادز اپل – هدفون به حسگرهای حرکتی مجهز است و حرکات سر کاربر (چرخش یا تغییر زاویه) را تشخیص می‌دهد.

سیستم صوتی بر این اساس جهت و شدت صدای هر منبع را به صورت دینامیک با حرکت سر تنظیم می‌کند تا منبع صوتی نسبت به فضای فیزیکی ثابت به نظر برسد. فرض کنید با آیپد خود در حال تماشای فیلم هستید و صدای Spatial Audio از طریق ایرپادز پخش می‌شود.

اگر سرتان را به سمت راست برگردانید، پردازندهٔ ایرپادز فوری صداها را طوری بازآوری می‌کند که انگار صدا همچنان از سمت صفحهٔ آیپد (که حالا نسبت به سر شما سمت چپ‌تان شده) به گوش می‌رسد. به بیان ساده، بر خلاف هدفون معمولی که با چرخاندن سر انگار کل صحنهٔ صدا همراه سر شما می‌چرخد، در Spatial Audio با ردیابی سر، صحنهٔ صوتی در فضای اتاق ثابت می‌مانَد و این طبیعی‌تر بودن تجربه را به همراه دارد. این فناوری به خصوص در ترکیب با واقعیت مجازی بسیار چشمگیر است؛ زیرا اگر در دنیای VR با چرخاندن سر، صداها هم ثابت در فضای مجازی بمانند، مغز شما فضای خلق‌شده را واقعی‌تر درک خواهد کرد.

در مجموع، صدای فضایی آخرین مرحله از تکامل فناوری‌های صوتی محسوب می‌شود که مرز بین صدای ضبط‌شده و صدای واقعی محیط را کم‌رنگ‌تر از همیشه کرده است. اگر صدای مونو یک نقاشی دوبعدی ساده از واقعیت صوتی بود و صدای استریو آن را رنگی‌تر و عمیق‌تر کرد، Spatial Audio را می‌توان یک مجسمهٔ تمام‌نما از صدا دانست که هر گوشه‌اش را بچرخانید بُعدی برای شنیدن دارد.

این فناوری‌ها به ما امکان می‌دهند هنگام گوش دادن به موسیقی یا تماشای فیلم و بازی، خود را واقعاً در صحنه احساس کنیم و صدا را همان‌گونه که طبیعتاً در اطراف‌مان جریان دارد تجربه کنیم.