فناوری نوین لب خوانی نوید می‌دهد که بتواند سمعک‌ها را با طبیعت انسان نزدیکتر سازد

در این مقاله طرحی فناورانه برای نوعی سمعک ارائه می‌شود که قادر به لب خوانی است و به این طریق قادر به حذف صداهای ناهماهنگ با حرکات لب خوانی است تا برای فرد کم شنوای پوشنده سمعک عمدتاً تنها صدای صاحب آن لب تقویت شود.

دوشنبه، 19 اسفند 1398

تخمین زمان مطالعه:

مترجم : فتانه خزاعی

موارد بیشتر برای شما

سمعک می‌تواند نجات دهنده برای افراد کم شنوا باشد. اما محدودیت‌های آنها می‌تواند به این معنا باشد که در محیط‌های مخصوصاً پر سر و صدا، کاربران نمی‌توانند از این بهترین فناوری‌های موجود بهره برداری کنند. بیشتر طرح‌های سمعک فقط پیشرفت‌های اندکی در میکروفن‌ها، راندمان انرژی و فیلتر صوتی ایجاد می‌کنند. ما یک رویکرد کاملاً جدید را پیشنهاد می‌کنیم که می‌تواند به نوعی نقش دیدن بوسیله دوربین و تحلیل حرکات لب را در کمک به انتخاب صدایی که شنونده می‌خواهد بشنود دخیل ‌کند.

من و همکارانم به عنوان بخشی از یک تیم چند رشته‌ای به سرپرستی دانشگاه استرلینگ فعالیت می‌کنیم، که شامل یک روان شناس و یک دانشمند بالینی است و این تیم توسط یک سازنده سمعک پشتیبانی می‌شود. هدف ما توسعه سمعک شنوایی - تصویری برای قرن بیست و یکم است، الهام گرفته از راهی که بدن انسان به طور طبیعی با موقعیت‌های پر سر و صدا تعامل می‌کند، چیزی که اغلب به عنوان اثر کوکتل پارتی معروف است.

سناریویی مانند یک مهمانی بسیار شلوغ را با صدای زیاد، موسیقی و صحبت کردن‌های دو به دوی افراد با هم دیگر تصور کنید. علی رغم این محیط مستغرق کننده، فردی که دارای قدرت شنوایی کامل است، اغلب قادر به انتخاب و گوش دادن به صدای کسی است که در مجاورتش قرار دارد. این چیزی است که افراد دارای سمعک اغلب آن را بسیار چالش برانگیز می‌یابند. راه حل ما این خواهد بود که دو باره به عملکرد انسانها توجه کنیم. این که چقدر لب خوانی انجام می‌دهیم بستگی به شرایط دارد. هرچه محیط پر سر و صداتر باشد، تمایل بیشتری به توجه به لب‌های افراد گوینده می‌بینیم. در حقیقت، در محیط‌های بسیار شلوغ بسیاری از افراد ناشنوا ممکن است ترجیح دهند سمعک خود را به طور کلی بردارند.

سر و کار داشتن با محیط‌های پر سر و صدا
پاسخ این سؤال که چرا برای سمعک‌ها سر و کار داشتن با این موقعیت‌ها این قدر دشوار است پیچیده است. این تا حدودی به محدودیت‌های میکروفن جهت دار، از بین بردن ناکافی نویز و از دست رفتن اطلاعات در مورد این که صدا از کجا می‌رسد بر می‌گردد. اما دلیل این که افراد کاملاً ناشنوا، که اصلاً نیازی به استفاده از سمعک ندارند، اغلب می‌توانند در محیط‌های شلوغی مانند آن چه در بالا گفته شد "بهتر" بشنوند، تا حدودی با قدرت لب خوانی آنها قابل توضیح است.

لب خواندن به افراد مبتلا به کم شنوایی کمک می‌کند تا گفتار را بهتر درک کنند. همه ما به میزانی بیشتر یا کمتر لب خوانی می‌کنیم، اما در افرادی که دچار کم شنوایی هستند این توانایی می‌تواند به یک مهارت حیاتی تبدیل شود. با این حال این یک جزئی از ارتباطات است که سمعک‌های موجود به سادگی از آن چشم پوشی می‌کنند. شاید راهی باشد که دیگر افراد کم شنوا به لبخند زدن و سر تکان دادن اکتفا نکنند.

بینایی ما برای گوش یا سمعک پوشیده بر بدن، ارتباط داده می‌شد با یک دوربین پوشیدنی کوچک، که می‌توانست در یک عینک معمولی، یا در زینت آلات بدن سوار شود یا حتی شاید به عنوان یک نشان پوشیدنی پوشیده شود. دستگاه، جریان ویدیویی دوربین را برای تفکیک اطلاعات مربوط به حرکات لب پردازش می‌کند.

این داده‌ها توسط سمعک به چندین روش قابل استفاده هستند. در یک سطح ساده‌، اگر متوجه شود کسی در حال صحبت کردن است، می‌تواند برخی از فیلترهای کاهش نویز پس زمینه عمومی را اعمال کند. این می‌تواند مسیری را که صدا از طریق آن می‌آید شناسایی کند و بر این اساس میکروفون جهت دار را متمرکز کند.

نکته قابل توجه این است که می‌تواند از اطلاعات مربوط به حرکت لب همچنین برای استفاده از فیلتر مناسب برای کاهش بیشتر نویز استفاده کند، همان طور که مغز ما به طور طبیعی عمل می‌کند. به طور خاص، اگر دستگاه بتواند وضعیت گفتار را تخمین بزند، می‌تواند عناصر صوتی‌ای را که با این وضعیت مطابقت ندارند حذف کند. به عنوان مثال، اگر موسیقی با صدای بلند پخش می‌شود، "خواندن" لب‌های بلندگوی هدف به دستگاه نشان می‌دهد که باید این موسیقی را حذف کند زیرا با صدای مورد انتظار مطابقت ندارد.

چالش‌ها چیست؟
برای اطمینان از این که سمعکی مانند این می‌تواند به صورت عملی در دنیای واقعی به وجود آید، چالش‌های متعددی وجود دارد شامل همان مشکلاتی که خوانندگان لب با آن رو به رو هستند. چنین سیستمی باید بتواند با چندین بلندگو به طور همزمان سر و کار داشته باشد و صدایی را که در مقابلش قرار ندارد بشنود. و، به طور کلی، مردم در مقابل شنونده به سادگی بی حرکت نمی‌ایستند، بلکه در عوض تمایل دارند که حرکت کنند، سر خود را بچرخانند، صورت خود را بپوشانند یا احساسات خود را به صورت بصری نشان دهند. این هم البته ممکن است که حرف آنها قطع شود یا شخص شنوده در حالی که آنها در حال صحبت هستند راهش را بکشد و برود.

برای غلبه بر این مشکل، راه حل ما این خواهد بود که دو باره به عملکرد انسانها توجه کنیم. این که چقدر لب خوانی انجام می‌دهیم بستگی به شرایط دارد. هرچه محیط پر سر و صداتر باشد، تمایل بیشتری به توجه به لب‌های افراد گوینده می‌بینیم. سناریویی مانند یک مهمانی بسیار شلوغ را با صدای زیاد، موسیقی و صحبت کردن‌های دو به دوی افراد با هم دیگر تصور کنید. علی رغم این محیط مستغرق کننده، فردی که دارای قدرت شنوایی کامل است، اغلب قادر به انتخاب و گوش دادن به صدای کسی است که در مجاورتش قرار دارد. این چیزی است که افراد دارای سمعک اغلب آن را بسیار چالش برانگیز می‌یابند. بنا بر این سیستمی که منحصراً لب خوانی می‌کند در هنگام صحبت‌های واقعی در محیط‌های واقعی خیلی مفید نخواهد بود. ما قصد داریم رویکرد خود را با سایر رویکردهای غیر دوربینی که سمعک‌ها در حال حاضر از آن استفاده می‌کنند، از جمله لغو نویز و وجود میکروفون جهت دار ادغام کنیم.

هدف ما تولید سیستمی با طراحی زیبا شناختی است که توانایی کاربران را در درک آن چه گفته می‌شود در طیف وسیعی از محیط‌ها، به طور بالقوه با تلاش کمتر برای گوش دادن، بهبود می‌بخشد. این امر با ارائه یک نمونه اولیه دستگاه شنوایی که در دسترس آزادانه قرار دارد و با الهام از روشی که ما به طور طبیعی فکر می‌کنیم، می‌شنویم و می بینیم، کمک می کند تا مشکلات واقعی پیش روی افرادی که دچار کم شنوایی هستند، از جمله کمبود فناوری در دسترس آنها، را حل کند.

منبع: امیر حسین - University of Stirling

سبک زندگی مرتبط

مقالات مرتبط

تازه های مقالات

بیشترین بازدید هفته