تحقق رویای ارتباط مغز و رایانه با سرپرستی دانشمند ایرانی

مهندسان مغز و اعصاب سیگنالهای مغز را بهصورت مستقیم به گفتار تبدیل کردند.
چگونه سیگنالهای مغزبه گفتار تبدیل می شود
در اولین گام از تلاش علمی جدید، مهندسان مغز و اعصاب سیستمی طراحی کرده اند که میتواند فکر را به گفتار ترجمه کند. این پیشرفت شگرف که بین قدرت بیان و صوت ترکیبی و هوش مصنوعی ارتباط دارد، میتواند در آیندهی نزدیک دنیایی را که در آن رایانهها بهطور مستقیم با مغز ارتباط برقرار میکنند، به واقعیت تبدیل کند. درحالیکه هماکنونامیدی برای کسانی است که در صحبت کردن ناتوان هستند.
این فناوری توسط مهندسان مغز و اعصاب دانشگاه کلمبیا در حال پیشرفت است، با نظارت بر فعالیتهای مغز توانسته کلماتی را که افراد میشنوند، با وضوح بیسابقهای نوسازی کند.
این موفقیت چشمگیر که قدرت سخنوری و هوش مصنوعی را با هم پیوند زده در دنیای مهندسی پزشکی (Biomedical engineering) مانند پرش از موانع بلند در راه خلق رایانههایی شگفتآور بحساب می آید که در ارتباط با کاربران انقلابی را ایجاد خواهند کرد.
مزیتهای فناوری تبدیل سیگنالهای مغزبه گفتار
از دیگر زمینههای کاربردی برای این فناوری کمک به افرادی است که نمیتوانند صحبت کنند. افرادی که دچار مشکلاتی از قبیل اسکلروز جانبی آمیوتروفیک (Amyotrophic lateral sclerosis) همانند استیون هاوکینگ معروف هستند یا افرادی که از سکته مغزی نجات یافتهاند، میتوانند به با این فناوری به زندگی دوباره برگردند ارتباط با جهان خارج امیدوار باشند؛ فناوری شگفتانگیزی که به مدیریت دکتر نیما مسگرانی در حال پیشرفت هرچه بیشتر است.
نظریه دکتر نیما مسگرانی درباره این تکنولوژی
دکتر نیما مسگرانی، نویسنده و عضو اصلی پژوهش در مؤسسه رفتار ذهنی مغز مورتیمر بی زاکرمن از دانشگاه کلمبیا است. دکتر مسگرانی معتقد است با نتایج مطالعات و پژوهشهای بدست آمده میتوانیم راهی برای بازگشت قدرت سخنوری داشته باشیم. نتایج پژوهشهای مسگرانی نشان داد که با فناوری مناسب، میتوان افکار دیگران را رمزگشایی و ازطریق گوش دادن قابل فهم کرد.
نتایج پژوهشهای پژوهشگران درباره ی تبدیل سیگنالهای مغز به گفتار
نتایج دهها پژوهش به پژوهشگران نشان داده بود که زمانی که افراد صحبت میکنند یا حتی تصور میکنند که صحبت میکنند، الگوهای گفتوگو در مغز آنها پدیدار میشود. الگوهایی متفاوت ولی قابل تشخیص از سیگنالها نیز هنگامی که ما به سخنان دیگران گوش میدهیم یا تصور میکنیم که گوش میدهیم، در مغز پدیدار میشود.
کارشناسان سعی میکنند این الگوهای مغزی را ثبت و حتی رمزگشایی کنند. آنها آیندهای را تصور میکنند که در آن افکاردرون مغز پنهان نیست و بدون نیاز به ترجمه به دیگران منتقل شود.
فعالیتهای دکتر مسگرانی برای تبدیل سیگنالهای مغز به گفتار
دکتر مسگرانی اولین تلاشها برای رمزگشایی سیگنالها را انجام داد، درحالیکه دیگر همکاران تیم او روی مسئلهی تجزیه و تحلیل اسپکتروگرامها و تبدیل به مدلهای رایانهای ساده تمرکز داشتند.
اسپکتروگرام پارامترهای اصوات همچون چگالی طیفی و فرکانس را بهصورت بصری نمایش میدهند که از نمونههای کاربردی آن سونوگرافی است. نتیجه این عمل برای تولید خروجی که به صحبت قابل فهم تبدیل شود، ناموفق بود؛ ازاینرو دکتر مسگرانی که دانشیار رشته مهندسی الکترونیک در بنیاد آموزشی فو کلمیبا و علوم کاربردی است، بههمراه تیمش به روی فناوری وکودر پژوهشهای خود را انجام می دهد.
دکتر مسگرانی بهدنبال یک الگوریتم رایانهای بود که بتواند پس از آموزش دیدن با سوابق گفتگوهای افراد، متن را به گفتار تبدیل کند. دکتر مسگرانی در اینباره میگوید:
این همان فناوریای است که آمازون اکو و اپل سیری برای پاسخ به درخواستهای کلامی ما استفاده میکنند.

روش دکتر مسگرانی برای رسیدن به این هدف
دکتر مسگرانی تصمیم گرفت در جهت تعلیم وکودر برای آنکه بتواند فعالیتهای مغزی را تفسیر کند با دکتر اشیش دینیش مِهتا همکاری کند. دکتر مهتا جراح مغز و اعصاب Northwell Healthدر مؤسسه عصبشناسی پزشکان همکار است که در یک شبکه مراقبتهای بهداشتی با مشارکت در حدود ۲۰ بیمارستان فعال است.
دکتر مهتا در today’s paper بهعنوان همکار نویسنده فعالیت دارد. دکتر مهتا بر روی درمان بیماران صرعی تمرکز دارد که باید تحت عمل جراحی منظم قرار گیرند.
به اعتقاد دکتر مسگرانی همکاری با دکتر مهتا و یاری خواستن از بیماران صرع در هنگام عمل و رصد الگوهای مغزی آنها در هنگام گوشدادن به صدای افراد مختلف اطلاعات خوبی برای تحلیل الگوها به تیم پژوهش داده و نتایج این الگوها بود که وکودر را برای انجام وظیفهاش آموزش میدادند.
در ادامهی طرح، پژوهشگران از همان بیماران درخواست کردند به صدای دیجیتالی رقمهای از ۰ تا ۹ گوش دهند. صداهای تولیدشده بهوسیله وکودر در پاسخ به این سیگنالها توسط شبکه عصبی که یک نوع هوش مصنوعی با توانایی تقلید ساختار نورونهای مغز بیولوژیک بود، آنالیز و پالوده شد.
نتیجه تلاشهای دکتر مسگرانی
نتیجه این تلاشها برای تیم تحقیقاتی دکتر مسگرانی موفقیت درخشانی بود. آنها متوجه شدند که افراد میتواند در ۷۵ درصد اوقات این صداهای تولیدشده را بفهمند و تکرار کنند و این نتیجه بالاتر از هر تلاشی بود که قبل انجام شده بود. بهبود و قابلیت فهم در ضبطهای جدید برپایه اسپکتروگرامهای قبلی بهطور مشهودی واضح بود. درحالی که قدرت و دقت وکودر و شبکه عصبی، ناشی از دقت شگفتآور بیماران در شنیدن صداهای اولیه بود. دکتر مسگرانی و تیم پژوهشهای او قصد دارند با آزمایش کلمهها و جملات مشکل کار را ادامه دهند.
در ادامه آنها همان آزمایشها را روی سیگنالهای مغز فرد انتشار می دهند. درحالیکه او تصور میکند درحال صحبت کردن است. آنها امیدوارند که در نهایت این فناوری همانند به بخشی از یک ایمپلنت مشابه یکی از انواعی که بیماران صرع استفاده میکنند، مبدل شود تا افکار را مستقیم به گفتار تبدیل کند.
مشخصات محصول ایمپلنت با استفاده ازاین تکنولوژی
در این محصول اگر صاحب ایمپلنت در این اندیشه باشد که به یک لیوان آب نیاز دارد، سیستم با تحلیل سینگالهای مغز میتواند این فکر را درک کند و آن را به گفتار تبدیل کند. دکتر مسگرانی معتقد است که این فناوری میتواند تحول عظیمی ایجاد کند. این سیستم به هر شخصی که دچار آسیب یا صدمه در گفتار است میتواند توانایی سخن گفتن را ببخشد تا برای ارتباط با دنیای اطراف فرصتی دوباره داشته باشد.