به گزارش باشگاه خبرنگاران جوان، در سال 2019، مجله MIT Press Reader دو مصاحبه با نوام چامسکی و استیون پینکر، دو نفر از برجستهترین دانشمندان زبانشناسی و شناختی جهان منتشر کرد. هنگامی که موضوع یادگیری ماشین و سهم آن در علوم شناختی مطرح می شود، نظرات آنها رنگ و بویی از شک و تردید و چیزی نزدیک به ناامیدی به خود می گیرد.. چامسکی میگوید: « صرف نظر از ارزشی که ممکن است برای ساخت وسایل مفید یا کاوش ویژگیهای آن داشته باشد تقریباً از هر جنبه، بررسی اینکه چگونه یادگیری ماشینی به علم کمک میکند دشوار است بهویژه در علم شناختی که فرآیندهای محاسباتی به کار گرفته شده است.»
در حالی که پینکر می گوید: «خود علم شناختی در دهه 1990 تحت الشعاع علوم اعصاب و هوش مصنوعی در این دهه قرار گرفت، اما من فکر میکنم که این رشتهها باید بر عقیم بودن نظری خود غلبه کنند و با مطالعه شناخت دوباره ادغام شوند. فیزیولوژی عصبی و یادگیری ماشینی هرکدام زمانی که به موانعی بر می خورند به هوش روشنگر می رسد.»
به هر اندازه که درک ما از هوش مصنوعی و انسان افزایش می یابد، موقعیت هایی مانند این ممکن است به زودی خود را در شرایطی ناپایدار بیابند. در حالی که هوش مصنوعی هنوز به شناختی شبیه انسان دست پیدا نکرده است، شبکههای عصبی مصنوعی که پردازش زبان را تکرار میکنند به طرز شگفتآوری شبیه به آنچه در ساختار مغز انسان میبینیم به نظر میرسند. در ماه نوامبر، گروهی از محققان در MIT مطالعهای را در مجموعه مقالات آکادمی ملی علوم منتشر کردند که نشان میدهد تحلیل روند یادگیری ماشینی میتواند پنجرهای به این مکانیسمهای عملکرد شناختی بالاتر مغز ارائه دهد. شاید حتی نکته شگفتانگیزتر این مطالعه این موضوع باشد که هوش مصنوعی در حال تحول همگرا با طبیعت است بدون اینکه کسی برای انجام این کار برنامهریزی کند.
هوش مصنوعی با استفاده از یادگیری ماشینی در سال های اخیر پیشرفت های چشمگیری به ویژه در زمینه تشخیص بصری داشته است. برای مثال اینستاگرام از هوش مصنوعی تشخیص تصویر برای توصیف عکسها برای افراد کم بینا استفاده میکند، گوگل از آن برای عملکرد جستجوی عکس معکوس استفاده میکند، و الگوریتمهای تشخیص چهره شرکتهایی مانند Clearview AI به سازمانهای مجری قانون کمک میکند تصاویر موجود در رسانههای اجتماعی را با تصاویر موجود در پایگاههای اطلاعاتی دولتی برای شناسایی افراد تحت تعقیب تطبیق دهند. جدای از بحث های مهم اخلاقی، این مکانیک نحوه عملکرد این الگوریتم ها است که می تواند عملکرد شناختی را واضح کند. با مقایسه فعالیت عصبی انسان دادههای با مدلهای یادگیری ماشینی شبکه عصبی مصنوعی با عملکردی مشابه محققان میتوانند بینشی در مورد این که کدام برنامهها بهتر کار میکنند و کدامیک عملکرد ضعیف تری دارند، به دست آورند. این مطالعات و بررسی ها نشان می دهند که عملکرد سیستم مذکور شباهت زیادی به نحوه انجام همان کار توسط مغز دارد.
مارتین شریمپ، اولین نویسنده مطالعه جدید MIT، در مصاحبه ای با Interesting Engineering توضیح داد: «ما در مدل سازی نواحی حسی مغز به ویژه در زمینه بینایی موفقیت هایی داشته ایم.» شریمپ دانشجوی دکتری دپارتمان مغز و علوم شناختی MIT، این مقاله را با Joshua Tenenbaum، مدرس علوم شناختی محاسباتی در MIT و یکی از اعضای آزمایشگاه هوش مصنوعی موسسه، و Evelina Fedorenko، دانشیار علوم اعصاب در دانشگاه، نوشتند. در پی این موفقیتها، مارتین درباره این موضوع کنجکاو شد که آیا میتوان همان اصل را برای عملکردهای شناختی سطح بالاتر مانند پردازش زبان به کار برد یا خیر. شریمپ گفت: «من پیشنهاد کردم که فقط به شبکه های عصبی موفق نگاه کنیم و ببینیم که آیا چیزی شبیه به مغز هستند یا خیر. شرط من این بود که حداقل تا حدودی جواب بدهد.»
یافتهای که بلافاصله توجه مارتین را جلب می کند این است که برخی از مدلها دادههای عصبی را به خوبی پیشبینی میکنند. به عبارت دیگر، صرف نظر از اینکه یک مدل چقدر در انجام یک کار خوب بوده است، برخی از آنها به نظر شبیه مکانیک شناختی مغز برای پردازش زبان هستند. به طرز جالبی، تیم MIT مدل های GPT را به عنوان شبیه ترین مغز در گروهی که آن را بررسی کردند، شناسایی کردند
GPT یک مدل یادگیری است که برای تولید انواع متن به زبان انسان آموزش دیده است. این توسط Open AI، آزمایشگاه تحقیقاتی هوش مصنوعی تاسیس شده توسط ایلان ماسک توسعه داده شد که در ژوئن امسال یک ابزار هوش مصنوعی جدید با قابلیت نوشتن کدهای کامپیوتری را معرفی کرد. تا همین اواخر، GPT-3، آخرین تکرار برنامه، تنها بزرگترین شبکه عصبی ایجاد شده با بیش از 175 میلیارد پارامتر یادگیری ماشینی بود. این یافته می تواند دریچه بزرگی را به نحوه انجام مغز حداقل بخشی از عملکرد شناختی سطح بالاتر مانند پردازش زبان باز کند. GPT بر اساس اصل پیش بینی کلمه بعدی در یک دنباله عمل می کند. مطابقت بسیار خوبی با دادههای بهدستآمده از اسکنهای مغزی نشان میدهد که هر کاری که مغز با پردازش زبان انجام میدهد، پیشبینی جزء کلیدی آن است.
شریمپ همچنین خاطرنشان میکند که در موقعیتهایی که متون و داستانهای طولانیتر به آزمودنیها نشان داده میشد، همه مدلهای شبکه عصبی در مقایسه با نحوه امتیازدهی آنها به متون کوتاه برد نسبتاً ضعیف عمل کردند. مارتین می گوید: «تفسیرهای مختلفی برای این موضوع وجود دارد. اما تفسیر هیجانانگیزتر، که با آنچه در حال حاضر یادگیری ماشینی به صورت شهودی انجام میدهد همخوانی دارد، این است که شاید این مدلها واقعاً در شکلدهی نمایشهای کوتاه برد مناسب خوب باشند اما هنگامی که شما زمینه های معنایی دارید که باید آن را جمع آوری کنید، شاید آنها کوتاهی کنند.
دومین یافته مهم این تیم چیزی را در مورد نحوه عملکرد شناخت ما در مورد زبان نشان می دهد، زیرا آنها وظایف زبانی مختلف را از طریق ترکیبی از هشت معیار مختلف که شامل جنبه هایی مانند دستور زبان، قضاوت و درهم تنیدگی بودند، آزمایش کردند. مارتین میگوید: «هیچکدام از آنها با هم مرتبط نبودند. بنابراین، حتی اگر این مدلها این وظایف را به خوبی انجام دهند، این به هیچ وجه پیشبینی نمیکند که چقدر با مغز مطابقت دارند. این چیزی است که به نظر می رسد سیستم زبان ما برای انجام آن بهینه شده است.»
برای درک دقیق اینکه چرا برخی از مدل ها بیشتر از بقیه شبیه مغز هستند، به مطالعه بیشتری نیاز است. این تا حدودی به این واقعیت مربوط می شود که در یادگیری ماشینی، مدل های هوش مصنوعی می توانند چیزی شبیه جعبه سیاه باشند، که در آن عملکردهای آنها به قدری پیچیده است که حتی افرادی که آنها را طراحی کرده اند ممکن است نتوانند درک کنند که چگونه متغیرهایی که وارد می شوند در آن مدل ها به یکدیگر مرتبط هستند. مارتین تصدیق می کند که تجزیه این متغیرها می تواند یک کار بزرگ باشد. او میگوید: «برای مدلهای جداگانه، ما هنوز نمیدانیم اگر یک لایه کمتر در شبکه عصبی یا واحدهای کمتر یا واحدهای بیشتری داشته باشیم، چه اتفاقی میافتد».
سومین یافته اصلی این مطالعه و یکی از آنها که منحصر به فردترین یافته آن را به نظریههای شناخت مرتبط میکند، این است که هر چه یک مدل هوش مصنوعی شبیه مغز باشد، بیشتر میتواند با رفتار انسان و زمانهای مطالعه فردی آزمودنیها مطابقت داشته باشد. کنار هم قرار دادن تصویر، ترکیب غیرمنتظره ای از دانش علمی را نشان می دهد که مارتین از آن به عنوان "مثلث" یاد می کند. مدلهایی که از پیشبینی کلمه بعدی استفاده میکنند، نمرات مغز سوژهها را منعکس میکنند، که به نوبه خود میتواند برای پیشبینی رفتار انسان استفاده شود.
مارتین همچنین میگوید: «من فکر میکنم این مثلث بینشها فوقالعاده جالب است. اکنون که از بینش و سایر زمینه ها درس هایی آموختیم، توانستیم همه اینها را در یک مطالعه جمع آوری کنیم. مدلهایی که در پیشبینی کلمه بعدی بهتر هستند، بهتر میتوانند پاسخهای عصبی را در مغز انسان پیشبینی کنند، و مدلهایی که پاسخهای عصبی را بهتر پیشبینی میکنند، بهتر میتوانند رفتار را در قالب زمانهای خودخوانی پیشبینی کنند. »
یکی از دلایلی که این مطالعه بسیار جذاب است این است که این بینش ها در مورد شناخت به طور همزمان به نوعی "تکامل هوش مصنوعی" در حال وقوع اشاره می کند، تحولی که تا همین اواخر مورد توجه قرار نگرفته بود. مهم است که به خاطر داشته باشید که هیچکس عمداً هیچ یک از این مدلها را طوری برنامهریزی نکرده است که مانند مغز عمل کنند، اما در طول ساخت و ارتقای آنها، به نظر میرسد که ما به فرآیندی شبیه فرآیندی که خود مغز را تولید میکند، برخورد کردهایم و شاید از این راه بتوانیم به افرادی که مشکلات درک زبان دارند کمک کنیم.
مارتین توضیح میدهد که وظایف پیشبینی زبان در نهایت شبیه مغز به نظر میرسند. ما در مقاله حدس می زنیم که شاید آنچه جامعه پردازش زبان طبیعی انجام می دهد چیزی شبیه تکامل جامعه باشد. اگر یک معماری AI را انتخاب کنید و به خوبی کار کند، سپس بخشهایی از آن را که کار میکنند، «جهش» میدهید، آن را با معماریهای دیگری که به خوبی کار میکنند ترکیب میکنید و معماریهای جدید میسازید. این معماری هر دو مدل مغز و هوش مصنوعی است که مارتین احساس میکند بینش بالقوه نهایی این مطالعه باشد، اگرچه این مدلی است که آثار آن هنوز در حال مشاهده است. در حالی که شبکههای عصبی را میتوان بر روی دادهها آموزش داد تا عملکرد بهتر یا مشابهتری با مغز داشته باشند، به نظر میرسد ساختار زیربنایی آنها اهمیت زیادی دارد.
بیشتر بخوانید
مارتین توضیح می دهد: «به نظر می رسد که این ساختارهای ذاتی در مدل ها چیزهای زیادی به شما می دهد. اگر به این مدلها نگاه کنید، هنوز چیزی حدود 50 درصد از آموزش آنها بر روی دادهها را به دست میآورید، اما فکر میکنم هیچکدام از ما انتظار نداشتیم که این ساختار شما را در فضای بازنمایی مناسب قرار دهد.
آینده تحقیقات هوش مصنوعی شریمپ و همکارانش بر گسترش یک پلتفرم اطلاعاتی متمرکز شدهاند که مقادیر زیادی از این نوع دادهها و مدلهای زبان را جمعآوری میکند و آنها را برای جامعه علمی در سطح وسیع برای کمک به تسریع پیشرفت بیشتر در دسترس قرار میدهد.
در حالی که هیچ هدف نهایی واحدی برای این نوع تحقیق وجود ندارد، مارتین تشخیص میدهد که ایجاد درک جامعتری از شناخت و در عین حال استفاده از این درک برای ایجاد برنامههای کاربردی عملی که قادر به کمک به افراد هستند، دو روی یک سکه هستند. او میگوید: «این چیزها از نظر علمی مفید هستند، زیرا آنها بخشی از یک فرضیه علمی یکپارچه از همه چیزهایی هستند که ما درباره یک فضای مغزی خاص میدانیم. من در حال حاضر روی تحریک مدلسازی کار میکنم. در حالت ایدهآل، سوژهای را روی صندلی داشته باشیم که به صفحهای خاکستری نگاه میکند، سپس از مدل میپرسیم: «اگر بخواهم باور کند که سگی را روی صفحه خاکستری میبیند، چه نوع واکنشی خواهد داد و درخواست کنیم که این واکنش را توضیح دهد. سپس مغز را بر اساس آن تحریک می کنیم، و آنها یک سگ را می بینند. من فکر می کنم این یک جهت خوب برای بینایی است. چیزی شبیه به این را می توان با زبان انجام داد.
همچنین این محقق درباره چگونگی کمک کردن به کسانی که مشکل زبان دارند گفت: من فکر می کنم یک جهت وجود دارد من محتاطانه امیدوار هستم. چنین تحقیقات و پروژه هایی بدون شک الهام بخش مکالمات جدیدی در زمینه های یادگیری ماشینی، علوم اعصاب و شناخت خواهند بود. همچنین بر یکی از بحثهای شدیدتر در جامعه علمی تأثیر میگذارد، بحثی که میپرسد آیا مغز اصلاً مدل خوبی برای یادگیری ماشینی است یا خیر، و آیا این موضوع حتی اهمیت دارد یا خیر.
انتهای پیام/