پیشتازتک پلاسسلامت و پزشکی

تحقق رویای ارتباط مغز و رایانه با سرپرستی دانشمند ایرانی

فیلم سینمایی سرخ پوست

مهندسان مغز و اعصاب سیگنال‌های مغز را به‌صورت مستقیم به گفتار تبدیل کردند.

چگونه سیگنالهای مغزبه گفتار تبدیل می شود

در اولین گام از تلاش علمی جدید، مهندسان مغز و اعصاب سیستمی طراحی کرده اند که می‌تواند فکر را به گفتار ترجمه کند. این پیشرفت شگرف که بین قدرت بیان و صوت ترکیبی و هوش مصنوعی ارتباط دارد، می‌تواند در آینده‌ی نزدیک دنیایی را که در آن رایانه‌ها به‌طور مستقیم با مغز ارتباط برقرار می‌کنند، به واقعیت تبدیل کند. درحالی‌که هم‌اکنونامیدی برای کسانی است که در صحبت کردن ناتوان هستند.

این فناوری  توسط مهندسان مغز و اعصاب دانشگاه کلمبیا در حال پیشرفت است، با نظارت بر فعالیت‌های مغز توانسته کلماتی را که افراد می‌شنوند، با وضوح بی‌سابقه‌ای نوسازی کند.

این موفقیت چشمگیر که قدرت سخنوری و هوش مصنوعی را با هم پیوند زده در دنیای مهندسی پزشکی (Biomedical engineering) مانند پرش از موانع بلند در راه خلق رایانه‌هایی شگفت‌آور  بحساب می آید که در ارتباط با کاربران انقلابی را ایجاد خواهند کرد.

مزیتهای فناوری تبدیل سیگنالهای مغزبه گفتار

از دیگر زمینه‌های کاربردی برای این فناوری کمک به افرادی است که نمی‌توانند صحبت کنند. افرادی که دچار مشکلاتی از قبیل اسکلروز جانبی آمیوتروفیک (Amyotrophic lateral sclerosis) همانند استیون هاوکینگ معروف هستند یا افرادی که از سکته مغزی نجات یافته‌اند، می‌توانند به با این فناوری به زندگی دوباره برگردند ارتباط با جهان خارج امیدوار باشند؛ فناوری شگفت‌انگیزی که به مدیریت دکتر نیما مسگرانی در حال پیشرفت هرچه بیشتر است.


نظریه دکتر نیما مسگرانی درباره این تکنولوژی

دکتر نیما مسگرانی، نویسنده و عضو اصلی پژوهش در مؤسسه رفتار ذهنی مغز مورتیمر بی زاکرمن از دانشگاه کلمبیا است. دکتر مسگرانی معتقد است با نتایج مطالعات و پژوهشهای بدست آمده می‌توانیم راهی برای بازگشت قدرت سخنوری داشته باشیم. نتایج پژوهش‌های مسگرانی نشان داد که با فناوری مناسب، می‌توان افکار دیگران را رمزگشایی و ازطریق گوش دادن قابل فهم کرد.

نتایج پژوهشهای پژوهشگران درباره ی تبدیل سیگنالهای مغز به گفتار

نتایج ده‌ها پژوهش به پژوهشگران نشان داده بود که زمانی که  افراد صحبت می‌کنند یا حتی تصور می‌کنند که صحبت می‌کنند، الگوهای گفت‌وگو در مغز آن‌ها پدیدار می‌شود. الگوهایی متفاوت ولی قابل تشخیص از سیگنال‌ها نیز هنگامی که ما به سخنان دیگران گوش می‌دهیم یا تصور می‌کنیم که گوش می‌دهیم، در مغز پدیدار می‌شود.

کارشناسان سعی می‌کنند این الگوهای مغزی را ثبت و حتی رمزگشایی کنند. آن‌ها آینده‌ای را تصور می‌کنند که در آن افکاردرون مغز پنهان نیست و بدون نیاز به ترجمه به دیگران منتقل شود.

فعالیتهای دکتر مسگرانی برای تبدیل سیگنالهای مغز به گفتار

دکتر مسگرانی اولین تلاش‌ها برای رمزگشایی سیگنال‌ها را انجام داد، درحالی‌که دیگر همکاران تیم او روی مسئله‌ی تجزیه و تحلیل اسپکتروگرام‌ها و تبدیل به مدل‌های رایانه‌ای ساده تمرکز داشتند.

اسپکتروگرام پارامترهای اصوات همچون چگالی طیفی و فرکانس را به‌صورت بصری نمایش می‌دهند که از نمونه‌های کاربردی آن سونوگرافی است. نتیجه این عمل برای تولید خروجی که به صحبت قابل فهم تبدیل شود، ناموفق بود؛ ازاین‌رو دکتر مسگرانی که دانشیار رشته مهندسی الکترونیک در بنیاد آموزشی فو کلمیبا و علوم کاربردی است، به‌‌همراه تیمش به روی فناوری وکودر پژوهشهای خود را انجام می دهد.

دکتر مسگرانی به‌دنبال یک الگوریتم رایانه‌ای بود که بتواند پس از آموزش دیدن با سوابق گفتگوهای افراد، متن را به گفتار تبدیل کند. دکتر مسگرانی در این‌باره می‌گوید:

این همان فناوری‌ای است که آمازون اکو و اپل سیری برای پاسخ به درخواست‌های کلامی ما استفاده می‌کنند.

روش  دکتر مسگرانی برای رسیدن به این هدف

دکتر مسگرانی تصمیم گرفت در جهت تعلیم وکودر برای آنکه بتواند فعالیت‌های مغزی را تفسیر کند با دکتر اشیش دینیش مِهتا همکاری کند. دکتر مهتا جراح مغز و اعصاب Northwell Healthدر مؤسسه عصب‌شناسی پزشکان همکار  است که در یک شبکه مراقبت‌های بهداشتی با مشارکت در حدود ۲۰ بیمارستان فعال است.

دکتر مهتا در today’s paper  به‌عنوان همکار نویسنده فعالیت دارد. دکتر مهتا بر روی درمان بیماران صرعی تمرکز دارد که باید تحت عمل جراحی منظم قرار گیرند.

به اعتقاد دکتر مسگرانی همکاری با دکتر مهتا و یاری خواستن از بیماران صرع در هنگام عمل و رصد الگوهای مغزی آن‌ها در هنگام گوش‌دادن به صدای افراد مختلف اطلاعات خوبی برای تحلیل الگوها به تیم پژوهش داده و نتایج این الگوها بود که وکودر را برای انجام وظیفه‌اش آموزش می‌دادند.

در ادامه‌ی طرح، پژوهشگران از همان بیماران درخواست کردند به صدای دیجیتالی رقمهای از ۰ تا ۹ گوش دهند. صداهای تولیدشده به‌وسیله وکودر در پاسخ به این سیگنال‌ها توسط شبکه عصبی که یک نوع هوش مصنوعی با توانایی تقلید ساختار نورون‌های مغز بیولوژیک بود، آنالیز و پالوده شد.

نتیجه تلاشهای دکتر مسگرانی

نتیجه این تلاش‌ها برای تیم تحقیقاتی دکتر مسگرانی موفقیت درخشانی بود. آن‌ها متوجه شدند که افراد می‌تواند در ۷۵ درصد اوقات این صداهای تولیدشده را بفهمند و تکرار کنند و این نتیجه بالاتر از هر تلاشی بود که قبل انجام شده بود. بهبود و قابلیت فهم در ضبط‌های جدید برپایه اسپکتروگرام‌های قبلی به‌طور مشهودی واضح بود. درحالی که قدرت و دقت وکودر و شبکه عصبی، ناشی از دقت شگفت‌آور بیماران در شنیدن صداهای اولیه بود. دکتر مسگرانی و تیم پژوهش‌های او قصد دارند با آزمایش کلمه‌ها و جملات مشکل کار را ادامه دهند.

در ادامه آن‌ها همان آزمایش‌ها را روی سیگنال‌های مغز فرد انتشار می دهند. درحالی‌که او  تصور می‌کند درحال صحبت کردن است.  آن‌ها امیدوارند که در نهایت این فناوری همانند به بخشی از یک ایمپلنت مشابه یکی از انواعی که بیماران صرع استفاده می‌کنند، مبدل شود تا افکار را مستقیم به گفتار تبدیل کند.

مشخصات محصول ایمپلنت با استفاده ازاین تکنولوژی

در این محصول اگر صاحب ایمپلنت در این اندیشه باشد که به یک لیوان آب نیاز دارد، سیستم با تحلیل سینگال‌های مغز می‌تواند این فکر را درک کند و آن را به گفتار تبدیل کند. دکتر مسگرانی معتقد است که این فناوری می‌تواند تحول عظیمی ایجاد کند. این سیستم به هر شخصی که دچار آسیب یا صدمه در گفتار است می‌تواند توانایی سخن گفتن را ببخشد تا برای ارتباط با دنیای اطراف فرصتی دوباره داشته باشد.

منبع
زومیت
برچسب ها
نمایش بیشتر

نوشته های مشابه

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا
بستن
بستن