سمعک کنترل شده با مغز آزمایشی دکتر مسگرانی (که بر روی صفحه نمایش داده شده است) یک راه حل امید بخش برای مشکل کوکتل پارتی که سمعک های امروزه را به ستوه آورده است ارائه می دهد. اعتبار: دایان بوندارف برای شرکت فناوری کلمبیا
مغز ما توانایی قابل توجهی برای برداشتن صداهای فردی در یک محیط پر سر و صدا مانند یک کافی شاپ و یا یک خیابان شلوغ شهر دارد. این چیزی است که حتی پیشرفته ترین سمعک ها برای انجام این کار تلاش می کنند. اما اکنون مهندسان کلمبیا در حال اعلام یک تکنولوژی آزمایشی هستند که استعداد طبیعی مغز را برای آشکار سازی و تقویت هر تک صدایی از میان صداهای بسیار تقلید می کند. این سمعک کنترل شده با مغز، در حالی که از هوش مصنوعی توان می گیرد، به صورت یک فیلتر اتوماتیک عمل می کند، امواج مغزی پوشندگانش را دیده بانی می کند، و صدایی که آنها بخواهند روی آن متمرکز شوند را تقویت می کند.
اگر چه هنوز در مراحل اولیه توسعه است، این تکنولوژی یک گام مهم در راستای سمعکهای بهتر است که پوشندگان سمعک را قادر می سازد با افراد اطراف خود یکپارچه تر و با کارآیی بیشتر صحبت کنند. این دستاورد در مجله پیشرفت های علمی توصیف شده است.
نیما مسگرانی، دارای مدرک دکترا، یک محقق عمده در مؤسسه رفتار مغزی ذهن مورتایمر بی زوکرمن کلمبیا و نویسنده ارشد مقاله گفت: "ناحیه مغزی که صدا را پردازش می کند، فوق العاده حساس و قدرتمند است؛ می تواند یک صدا نسبت به دیگر صداها تقویت کند، ظاهراً حتی بدون زحمت، در حالی که سمعک های امروزه هنوز در مقایسه بین صداها رنگ می بازند." "با ایجاد یک دستگاه که خودش قدرت مغز را مهار کند، امیدواریم که کار ما به پیشرفت های تکنولوژیکیای منجر شود که صدها میلیون نفر از افراد مبتلا به اختلالات شنوایی در سراسر جهان بتوانند برای برقراری ارتباط با دوستان و خانواده خود به راحتی ارتباط برقرار کنند."
سمعک های مدرن در تقویت گفتار عالی هستند در حالی که به فرو نشاندن انواع خاصی از سر و صدای پس زمینه، مانند صدای ترافیک می پردازند. اما آنها برای بالا بردن حجم یک صدای منفرد نسبت به دیگر صداها تلاش می کنند. دانشمندان این را مشکل کوکتل پارتی می نامند، که اشاره دارد به ناهنجاری صداهایی که در خلال پارتی های بلند در هم مخلوط می شوند.
دکتر مسگرانی، که همچنین استادیار مهندسی برق در مهندسی کلمبیا است، گفت: "در مکان های شلوغ، مثل پارتی ها، سمعک ها تمایل دارند که اصوات تمام سخنرانان را یک جا تقویت کنند." "این به شدت مانع از توانایی پوشنده سمعک برای صحبت کردن به طور موثر است، و اساساً او را از افراد اطراف خود منزوی می کند."
سمعک کنترل شده توسط مغز تیم کلمبیا متفاوت است. به جای تکیه صرف بر تقویت کننده های صدای خارجی، مانند میکروفون ها، امواج مغزی خود شنونده را نیز دیده بانی می کند.
دکتر مسگرانی گفت: "پیش از این، ما کشف کرده بودیم که وقتی دو نفر با یکدیگر صحبت می کنند، امواج مغزی سخنران شروع به شباهت به امواج مغزی شنونده می کند."
با استفاده از این دانش، تیم الگوریتم های جدا سازی گفتاری قدرتمند را با شبکه های عصبی، مدل های پیچیده ریاضی که توانایی های محاسباتی طبیعی مغز را تقلید می کنند، ترکیب کرد. پیش از این، ما کشف کرده بودیم که وقتی دو نفر با یکدیگر صحبت می کنند، امواج مغزی سخنران شروع به شباهت به امواج مغزی شنونده می کند. آنها یک سیستم ایجاد کردند که ابتدا صدای سخنرانان منفرد را از یک گروه جدا می کند و سپس صدای هر سخنران را با امواج مغزی شخص شنونده مقایسه می کند. سپس صدای سخنرانی که الگوی صدایش بیشترین نزدیکی را با امواج مغزی شنونده داشته باشد بیش از بقیه تقویت می شود.
محققان نسخه قبلی این سیستم را در سال 2017 منتشر کردند که در حالی که نوید بخش بود، یک محدودیت کلیدی داشت: برای تشخیص سخنرانان مشخص نیاز به پیش تمرین داشت.
دکتر مسگرانی توضیح داد: "اگر شما در یک رستوران با خانواده خود باشید، آن دستگاه صدای آنها را برای شما تشخیص می دهد و رمز گشایی می کند." "اما به محض این که یک شخص جدید، مثل پیشخدمت، وارد شود، سیستم عقیم می ماند."
پیشرفت امروز تا حد زیادی آن مسئله را حل می کند. با سرمایه گذاری از طرف شرکت Columbia Technology Ventures برای بهبود الگوریتم اصلی، دکتر مسگرانی و اولین نویسندگان، دکتر کونگ هان و دکتر جیمز اُسولیوان، دوباره قدرت شبکه های عصبی عمیق را، برای ساخت یک مدل پیچیده تر که بتواند به هر سخنران بالقوه ای که شنونده با او روبرو می شود تعمیم داده شود، مهار کردند.
دکتر مسگرانی گفت: "نتیجه نهایی ما یک الگوریتم جدا سازی گفتار بود که مشابه با نسخه های قبلی اجرا می شد، اما با یک پیشرفت قابل ملاحظه." "می توانست یک صدا را – هر صدایی که باشد – تشخیص دهد و رمز گشایی کند، درست مثل خفاش".
برای تست کارایی الگوریتم، محققان با دکتر آشش دینش مِهتا، که یک جراح مغز و اعصاب در مؤسسه سلامتی نورتوِل برای عصب شناسی و جراحی اعصاب، و نویسنده همکار مقاله است هم تیم شدند. دکتر مهتا بیماران صرع را درمان می کند، بعضی از آنها باید تحت عمل جراحی منظم قرار گیرند.
دکتر مسگرانی گفت: "این بیماران داوطلب شدند برای گوش دادن به سخنرانان مختلف، در حالی که ما امواج مغزی آنها را به طور مستقیم از طریق الکترود هایی که در مغز بیماران وارد شده بودند، نظارت می کردیم." "سپس ما الگوریتم تازه توسعه داده شده را در مورد آن داده ها اعمال کردیم."
الگوریتم تیم توجه بیماران را، همان طور که آنها به سخنرانان مختلفی گوش می کردند که قبلاً صدای آنها را نشنیده بودند، دنبال می کرد. هنگامی که یک بیمار بر روی یک سخنران متمرکز می شد، سیستم به طور خودکار صدای او را تقویت می کرد. هنگامی که توجه آنها به یک سخنران دیگر معطوف می شد، سطوح حجم صدا به گونه ای تغییر می کرد که منعکس کننده آن شیفت بود.
در حالی که از این نتایج خود تشویق شده اند، محققان در حال تحقیق در مورد چگونگی تبدیل این نمونه به یک دستگاه غیر تهاجمی هستند به کونه ای که بتوانند آن را به صورت خارجی بر روی پوست سر یا اطراف گوش قرار دهند. آنها همچنین امیدوارند که الگوریتم را بهبود داده و اصلاح کنند تا بتواند در محدوده گسترده ای از محیط کار کند.
منبع: دانشگاه کلمبیا
مغز ما توانایی قابل توجهی برای برداشتن صداهای فردی در یک محیط پر سر و صدا مانند یک کافی شاپ و یا یک خیابان شلوغ شهر دارد. این چیزی است که حتی پیشرفته ترین سمعک ها برای انجام این کار تلاش می کنند. اما اکنون مهندسان کلمبیا در حال اعلام یک تکنولوژی آزمایشی هستند که استعداد طبیعی مغز را برای آشکار سازی و تقویت هر تک صدایی از میان صداهای بسیار تقلید می کند. این سمعک کنترل شده با مغز، در حالی که از هوش مصنوعی توان می گیرد، به صورت یک فیلتر اتوماتیک عمل می کند، امواج مغزی پوشندگانش را دیده بانی می کند، و صدایی که آنها بخواهند روی آن متمرکز شوند را تقویت می کند.
اگر چه هنوز در مراحل اولیه توسعه است، این تکنولوژی یک گام مهم در راستای سمعکهای بهتر است که پوشندگان سمعک را قادر می سازد با افراد اطراف خود یکپارچه تر و با کارآیی بیشتر صحبت کنند. این دستاورد در مجله پیشرفت های علمی توصیف شده است.
نیما مسگرانی، دارای مدرک دکترا، یک محقق عمده در مؤسسه رفتار مغزی ذهن مورتایمر بی زوکرمن کلمبیا و نویسنده ارشد مقاله گفت: "ناحیه مغزی که صدا را پردازش می کند، فوق العاده حساس و قدرتمند است؛ می تواند یک صدا نسبت به دیگر صداها تقویت کند، ظاهراً حتی بدون زحمت، در حالی که سمعک های امروزه هنوز در مقایسه بین صداها رنگ می بازند." "با ایجاد یک دستگاه که خودش قدرت مغز را مهار کند، امیدواریم که کار ما به پیشرفت های تکنولوژیکیای منجر شود که صدها میلیون نفر از افراد مبتلا به اختلالات شنوایی در سراسر جهان بتوانند برای برقراری ارتباط با دوستان و خانواده خود به راحتی ارتباط برقرار کنند."
سمعک های مدرن در تقویت گفتار عالی هستند در حالی که به فرو نشاندن انواع خاصی از سر و صدای پس زمینه، مانند صدای ترافیک می پردازند. اما آنها برای بالا بردن حجم یک صدای منفرد نسبت به دیگر صداها تلاش می کنند. دانشمندان این را مشکل کوکتل پارتی می نامند، که اشاره دارد به ناهنجاری صداهایی که در خلال پارتی های بلند در هم مخلوط می شوند.
دکتر مسگرانی، که همچنین استادیار مهندسی برق در مهندسی کلمبیا است، گفت: "در مکان های شلوغ، مثل پارتی ها، سمعک ها تمایل دارند که اصوات تمام سخنرانان را یک جا تقویت کنند." "این به شدت مانع از توانایی پوشنده سمعک برای صحبت کردن به طور موثر است، و اساساً او را از افراد اطراف خود منزوی می کند."
سمعک کنترل شده توسط مغز تیم کلمبیا متفاوت است. به جای تکیه صرف بر تقویت کننده های صدای خارجی، مانند میکروفون ها، امواج مغزی خود شنونده را نیز دیده بانی می کند.
دکتر مسگرانی گفت: "پیش از این، ما کشف کرده بودیم که وقتی دو نفر با یکدیگر صحبت می کنند، امواج مغزی سخنران شروع به شباهت به امواج مغزی شنونده می کند."
با استفاده از این دانش، تیم الگوریتم های جدا سازی گفتاری قدرتمند را با شبکه های عصبی، مدل های پیچیده ریاضی که توانایی های محاسباتی طبیعی مغز را تقلید می کنند، ترکیب کرد. پیش از این، ما کشف کرده بودیم که وقتی دو نفر با یکدیگر صحبت می کنند، امواج مغزی سخنران شروع به شباهت به امواج مغزی شنونده می کند. آنها یک سیستم ایجاد کردند که ابتدا صدای سخنرانان منفرد را از یک گروه جدا می کند و سپس صدای هر سخنران را با امواج مغزی شخص شنونده مقایسه می کند. سپس صدای سخنرانی که الگوی صدایش بیشترین نزدیکی را با امواج مغزی شنونده داشته باشد بیش از بقیه تقویت می شود.
محققان نسخه قبلی این سیستم را در سال 2017 منتشر کردند که در حالی که نوید بخش بود، یک محدودیت کلیدی داشت: برای تشخیص سخنرانان مشخص نیاز به پیش تمرین داشت.
دکتر مسگرانی توضیح داد: "اگر شما در یک رستوران با خانواده خود باشید، آن دستگاه صدای آنها را برای شما تشخیص می دهد و رمز گشایی می کند." "اما به محض این که یک شخص جدید، مثل پیشخدمت، وارد شود، سیستم عقیم می ماند."
پیشرفت امروز تا حد زیادی آن مسئله را حل می کند. با سرمایه گذاری از طرف شرکت Columbia Technology Ventures برای بهبود الگوریتم اصلی، دکتر مسگرانی و اولین نویسندگان، دکتر کونگ هان و دکتر جیمز اُسولیوان، دوباره قدرت شبکه های عصبی عمیق را، برای ساخت یک مدل پیچیده تر که بتواند به هر سخنران بالقوه ای که شنونده با او روبرو می شود تعمیم داده شود، مهار کردند.
دکتر مسگرانی گفت: "نتیجه نهایی ما یک الگوریتم جدا سازی گفتار بود که مشابه با نسخه های قبلی اجرا می شد، اما با یک پیشرفت قابل ملاحظه." "می توانست یک صدا را – هر صدایی که باشد – تشخیص دهد و رمز گشایی کند، درست مثل خفاش".
برای تست کارایی الگوریتم، محققان با دکتر آشش دینش مِهتا، که یک جراح مغز و اعصاب در مؤسسه سلامتی نورتوِل برای عصب شناسی و جراحی اعصاب، و نویسنده همکار مقاله است هم تیم شدند. دکتر مهتا بیماران صرع را درمان می کند، بعضی از آنها باید تحت عمل جراحی منظم قرار گیرند.
دکتر مسگرانی گفت: "این بیماران داوطلب شدند برای گوش دادن به سخنرانان مختلف، در حالی که ما امواج مغزی آنها را به طور مستقیم از طریق الکترود هایی که در مغز بیماران وارد شده بودند، نظارت می کردیم." "سپس ما الگوریتم تازه توسعه داده شده را در مورد آن داده ها اعمال کردیم."
الگوریتم تیم توجه بیماران را، همان طور که آنها به سخنرانان مختلفی گوش می کردند که قبلاً صدای آنها را نشنیده بودند، دنبال می کرد. هنگامی که یک بیمار بر روی یک سخنران متمرکز می شد، سیستم به طور خودکار صدای او را تقویت می کرد. هنگامی که توجه آنها به یک سخنران دیگر معطوف می شد، سطوح حجم صدا به گونه ای تغییر می کرد که منعکس کننده آن شیفت بود.
در حالی که از این نتایج خود تشویق شده اند، محققان در حال تحقیق در مورد چگونگی تبدیل این نمونه به یک دستگاه غیر تهاجمی هستند به کونه ای که بتوانند آن را به صورت خارجی بر روی پوست سر یا اطراف گوش قرار دهند. آنها همچنین امیدوارند که الگوریتم را بهبود داده و اصلاح کنند تا بتواند در محدوده گسترده ای از محیط کار کند.
منبع: دانشگاه کلمبیا