محققان MIT به تازگی یک هوش مصنوعی کشف کردند که به تنهایی از مغز تقلید می کند، طبق این کشف ادعا می شود که شروع یادگیری ماشینی شباهت زیادی به شناخت انسان دارد.
در سال 2019، مجله MIT Press Reader دو مصاحبه با نوام چامسکی و استیون پینکر، دو تن از برجستهترین دانشمندان زبانشناسی و شناختی جهان منتشر کرد. مکالمات، مانند خود مردان، در قالب بندی و برخورد با مسائل کلیدی پیرامون حوزه های تخصصی آنها متفاوت است. با این حال، هنگامی که در مورد یادگیری ماشینی و کمک های آن به علوم شناختی سؤال می شود، نظرات آنها زیر پرچم شک و تردید و چیزی نزدیک به ناامیدی جمع می شوند.
چامسکی میگوید: «تقریباً از هر جنبه مرتبط، دیدن اینکه چگونه [یادگیری ماشینی] هر نوع کمکی به علم میکند دشوار است، بهویژه در علم شناختی، صرف نظر از ارزشی که ممکن است برای ساخت ابزارهای مفید یا برای کاوش در ویژگیهای آن داشته باشد. فرآیندهای محاسباتی به کار گرفته شده است."
در حالی که پینکر لحن کمی ملایمتر را به کار میگیرد، او عدم اشتیاق چامسکی را در مورد اینکه چگونه هوش مصنوعی درک ما از مغز را ارتقا داده است، تکرار میکند:
خود علم شناختی در دهه 1990 تحت الشعاع علوم اعصاب و هوش مصنوعی در این دهه قرار گرفت، اما من فکر میکنم این رشتهها باید بر عقیم بودن نظری خود غلبه کنند و با مطالعه شناخت مجدداً ادغام شوند - فیزیولوژی عصبی و یادگیری ماشینی هرکدام به دیوارها برخورد میکنند. به هوش روشنگر می رسد."
اما با افزایش درک ما از هوش مصنوعی و انسانی، موقعیتهایی مانند این ممکن است به زودی خود را در زمینی ناپایدار بیابند. در حالی که هوش مصنوعی هنوز به شناختی شبیه انسان دست پیدا نکرده است، شبکههای عصبی مصنوعی که پردازش زبان را تکرار میکنند - سیستمی که تصور میشود جزء مهمی در پشت شناخت بالاتر است - بهطور شگفتآوری شبیه به آنچه در مغز میبینیم به نظر میرسد.
در ماه نوامبر(آبان یا آذر)، گروهی از محققان در MIT مطالعهای را در مجموعه مقالات آکادمی ملی علوم منتشر کردند که نشان میدهد تحلیل روند یادگیری ماشینی میتواند پنجرهای را به این مکانیسمهای عملکرد شناختی بالاتر مغز ارائه دهد. شاید حتی شگفتانگیزتر این استنباط این مطالعه باشد که هوش مصنوعی در حال تحول همگرا با طبیعت است - بدون اینکه کسی آن را برای انجام این کار برنامهریزی کند.
هوش مصنوعی با استفاده از یادگیری ماشینی در سالهای اخیر پیشرفتهای چشمگیری داشته است، به خصوص در زمینه تشخیص بصری. اینستاگرام از هوش مصنوعی تشخیص تصویر برای توصیف عکسها برای افراد کم بینا استفاده میکند، گوگل از آن برای عملکرد جستجوی عکس معکوس استفاده میکند، و الگوریتمهای تشخیص چهره شرکتهایی مانند Clearview AI به سازمانهای مجری قانون کمک میکند تا تصاویر موجود در رسانههای اجتماعی را با تصاویر موجود در پایگاههای اطلاعاتی دولتی برای شناسایی افراد تحت تعقیب مطابقت دهند.
جدای از بحثهای اخلاقی مهم، این مکانیک نحوه عملکرد این الگوریتمها است که میتواند عملکرد شناختی را روشن سازد. با مقایسه فعالیت عصبی انسان و نخستیهای غیرانسان با دادههای مدلهای یادگیری ماشینی شبکه عصبی مصنوعی با عملکردی مشابه - مثلاً تشخیص تصویر در یک پسزمینه آشفته - محققان میتوانند بینشی در مورد اینکه کدام برنامهها بهتر کار میکنند و کدام برنامهها را مقایسه میکنند. شباهت زیادی به این دارد که مغز چگونه کار مشابهی را انجام می دهد.
برای یافتن این موضوع، مارتین و همکارانش دادههای 43 مدل زبان شبکه عصبی مصنوعی را در مقابل ضبطهای عصبی fMRI و ECoG که در حین گوش دادن یا خواندن کلمات به عنوان بخشی از متن توسط افراد گرفته شده بود، مقایسه کردند. مدلهای هوش مصنوعی که گروه مورد بررسی قرار گرفتند، تمام کلاسهای اصلی رویکردهای شبکههای عصبی موجود برای وظایف مبتنی بر زبان را پوشش میداد. برخی از آنها مدلهای تعبیهسازی اولیهتر بودند مانند GloVe، که کلمات مشابه معنایی را در گروهها با هم جمع میکند. مدلهای دیگر، مانند مدلهایی که GPT و BERT نامیده میشوند، بسیار پیچیدهتر بودند. این مدلها به ترتیب برای پیشبینی کلمه بعدی در یک دنباله یا پیشبینی کلمه گمشده در یک زمینه خاص آموزش داده میشوند.
مارتین توضیح می دهد: "تنظیم به خودی خود بسیار ساده است." «شما فقط همان محرک هایی را به مدل هایی که به سوژه ها نشان می دهید نشان می دهید [...]. در پایان روز، شما با دو ماتریس باقی میمانید و آزمایش میکنید که آیا آن ماتریسها شبیه هم هستند یا خیر.
یافتهای که فوراً به چشم مارتین میآید این است که برخی از مدلها دادههای عصبی را به خوبی پیشبینی میکنند. به عبارت دیگر، صرف نظر از اینکه یک مدل چقدر در انجام یک کار خوب بوده است، به نظر می رسد برخی از آنها شبیه مکانیک شناختی مغز برای پردازش زبان هستند. به طرز جالبی، تیم MIT انواع مدل GPT را به عنوان شبیهترین مغز در گروهی که مورد بررسی قرار دادند، شناسایی کردند.
GPT یک مدل آموزشی است که برای تولید انواع متن به زبان انسان آموزش دیده است. این توسط Open AI، آزمایشگاه تحقیقاتی هوش مصنوعی تأسیس شده توسط ایلان ماسک توسعه یافته است که در ژوئن امسال یک ابزار هوش مصنوعی جدید با قابلیت نوشتن کدهای کامپیوتری را نشان داد. تا همین اواخر، GPT-3، آخرین تکرار این برنامه، تنها بزرگترین شبکه عصبی ایجاد شده با بیش از 175 میلیارد پارامتر یادگیری ماشین بود.
این یافته میتواند پنجره بزرگی را به نحوه انجام حداقل بخشی از عملکرد شناختی سطح بالاتر مانند پردازش زبان توسط مغز باز کند. GPT بر اساس یک اصل برای پیش بینی کلمه بعدی در یک دنباله عمل می کند. مطابقت بسیار خوبی با دادههای بهدستآمده از اسکنهای مغزی نشان میدهد که هر کاری که مغز با پردازش زبان انجام میدهد، پیشبینی یکی از اجزای اصلی آن است.
شریمپ همچنین خاطرنشان میکند که در موقعیتهایی که متون و داستانهای طولانیتر به آزمودنیها نشان داده میشد، همه مدلهای شبکه عصبی در مقایسه با نحوه امتیازدهی آنها به متون کوتاه برد نسبتاً ضعیف بودند.
مارتین میگوید: «تفسیرهای متفاوتی برای این موضوع وجود دارد. اما تفسیر هیجانانگیزتر، که فکر میکنم با آنچه در حال حاضر یادگیری ماشینی بهطور شهودی انجام میشود، همخوانی دارد، این است که شاید این مدلها واقعاً در شکلدهی نمایشهای کوتاه برد مناسب خوب باشند. اما زمانی که شما [...] زمینه معنایی دارید که باید آن را جمع آوری کنید، شاید در اینجاست که آنها کوتاهی می کنند. اگر تا به حال با یکی از این عوامل چت در مرورگر خود بازی کرده باشید، ممکن است متوجه چیزی مشابه شده باشید، جایی که به خوبی شروع می شود و خیلی سریع از بین می رود.
دومین یافته مهم این تیم چیزی را در مورد نحوه عملکرد شناخت ما در مورد زبان نشان می دهد، زیرا آن ها وظایف زبانی مختلف را از طریق ترکیبی از هشت معیار مختلف که شامل جنبه هایی مانند دستور زبان، قضاوت و درهم تنیدگی می شد، آزمایش کردند.
مارتین میگوید: «هیچکدام از آنها همبستگی نداشتند. بنابراین، حتی اگر این مدلها این وظایف را به خوبی انجام دهند، این به هیچ وجه نمیتواند پیشبینی کند که چقدر با مغز تطابق خواهند داشت. بنابراین، واقعاً به نظر میرسد که این کار پیشبینی چیزی خاص است. به نظر می رسد این چیزی است که سیستم زبان ما برای انجام آن بهینه شده است.»
برای درک دقیق این موضوع که چرا برخی از مدل ها بیشتر از بقیه شبیه مغز هستند، مطالعات بیشتری لازم است. این تا حدودی به این واقعیت مربوط می شود که در یادگیری ماشینی، مدل های هوش مصنوعی می توانند چیزی شبیه یک جعبه سیاه باشند، که در آن عملکردهای آنها به قدری پیچیده است که حتی افرادی که آنها را طراحی کرده اند ممکن است نتوانند درک کنند که چگونه متغیرهایی که وارد آن می شوند. مدل ها به یکدیگر مرتبط هستند مارتین تصدیق میکند که تجزیه این متغیرها میتواند کار بزرگی باشد.
او میگوید: «برای مدلهای جداگانه، ما هنوز نمیدانیم اگر یک لایه کمتر [در شبکه عصبی] یا واحدهای کمتر یا واحدهای بیشتر داشته باشیم، چه اتفاقی میافتد. اما پروژههایی وجود دارند که سعی میکنند مدلها را از هم جدا کنند و همه اجزای مختلف را از بین ببرند و ببینند چه چیزی واقعاً این مسابقه را به مغز میبرد.»
سومین یافته اصلی این مطالعه و یکی از آنها که منحصر به فردترین یافته آن را به نظریههای شناخت مرتبط میکند، این است که هر چه یک مدل هوش مصنوعی بیشتر شبیه مغز باشد، بیشتر میتواند با رفتار انسان، در این مورد، زمانهای خواندن فردی آزمودنیها مطابقت داشته باشد.
کنار هم قرار دادن تصویر، ترکیب غیرمنتظره ای از دانش علمی را آشکار می کند که مارتین از آن به عنوان "مثلث" یاد می کند. مدلهایی که از پیشبینی کلمه بعدی استفاده میکنند، نمرات مغز سوژهها را منعکس میکنند که به نوبه خود میتوانند برای پیشبینی رفتار انسان استفاده شوند.
مارتین با هیجان میگوید: «من فکر میکنم این مثلث [بینشها] فوقالعاده باحال است. «اکنون که از بینش و سایر زمینهها درس گرفتهایم، توانستیم همه اینها را در یک مطالعه جمع آوری کنیم. مدلهایی که در پیشبینی کلمه بعدی بهتر هستند، بهتر میتوانند پاسخهای عصبی را در مغز انسان پیشبینی کنند، و مدلهایی که پاسخهای عصبی را بهتر پیشبینی میکنند، بهتر میتوانند رفتار را در قالب زمانهای خواندن خود گام پیشبینی کنند.
یکی از دلایلی که این مطالعه بسیار جذاب است این است که این بینشها در مورد شناخت به طور همزمان به نوعی «تکامل هوش مصنوعی» در حال وقوع اشاره میکنند، تحولی که تا همین اواخر مورد توجه قرار نمیگرفت. مهم است که به خاطر داشته باشید که هیچکس عمداً هیچ یک از این مدلها را طوری برنامهریزی نکرده است که مانند مغز عمل کنند، اما در طول ساخت و ارتقای آنها، به نظر میرسد که ما به فرآیندی شبیه به فرآیندی که خود مغز را تولید میکند دچار شدهایم.
«ما در این مقاله حدس میزنیم که شاید آنچه جامعه پردازش زبان طبیعی انجام میدهد، چیزی شبیه تکامل جامعه باشد. اگر یک معماری AI را انتخاب کنید و به خوبی کار کند، آنگاه بخشهایی از آن را که کار میکنند، «جهش» میدهید، آن را با معماریهای دیگری که به خوبی کار میکنند ترکیب میکنید و معماریهای جدید میسازید. حداقل به معنای وسیع آن [با تکامل] تفاوت زیادی ندارد.»
این معماری هر دو مدل مغز و هوش مصنوعی است که مارتین احساس می کند بینش بالقوه نهایی این مطالعه است، اگرچه این مدلی است که لبه های آن هنوز در معرض دید قرار می گیرند. در حالی که شبکههای عصبی را میتوان بر روی دادهها آموزش داد تا عملکرد بهتر یا مشابهتری با مغز داشته باشند، به نظر میرسد که ساختار زیربنایی آنها بسیار مهم است.
مارتین توضیح میدهد: «به نظر میرسد که این ساختارهای ذاتی [در مدلها] چیزهای زیادی به شما میدهند. اگر به این مدلها نگاه کنید، باز هم چیزی حدود 50 درصد از آموزش [آنها بر روی دادهها] به دست میآورید، اما فکر میکنم هیچکدام از ما انتظار نداشتیم که این ساختار شما را در فضای بازنمایی مناسبی قرار دهد.»
شریمپ و همکارانش بر گسترش یک پلتفرم اطلاعاتی متمرکز شدهاند که مقادیر زیادی از این نوع دادهها و مدلهای زبان را جمعآوری میکند و آنها را برای جامعه علمی به طور کلی برای کمک به تسریع پیشرفت بیشتر در دسترس قرار میدهد.
در حالی که هیچ هدف نهایی واحدی برای این نوع تحقیق وجود ندارد، مارتین تشخیص میدهد که ایجاد درک جامعتری از شناخت و در عین حال استفاده از این درک برای ایجاد برنامههای کاربردی عملی که قادر به کمک به مردم هستند، دو روی یک سکه هستند.
او میگوید: «این چیزها از نظر علمی مفید هستند، زیرا بخشی از یک فرضیه علمی یکپارچه از همه چیزهایی هستند که ما در مورد یک فضای مغزی خاص میدانیم. من [همچنین] در حال حاضر بر روی تحریک مدلسازی کار میکنم. بنابراین، در حالت ایدهآل، سوژهای را روی صندلی داشته باشیم که به صفحهای خاکستری نگاه میکند، سپس از مدل میپرسیم: «اگر بخواهم سوژه را وادار کنم که سگی را ببیند، چه نوع تحریکی خواهم داشت. درخواست کنیم؟» و سپس مغز را بر این اساس ضایع می کنیم و آنها یک سگ را می بینند. من فکر می کنم این یک جهت خوب برای بینایی است. چیزی شبیه به آن را میتوان با زبان انجام داد. شاید بتوانیم به افرادی که در زمینه درک زبان مشکل دارند کمک کنیم. من فکر می کنم یک جهت وجود دارد - من محتاطانه امیدوارم."
مارتین میگوید: «مردم به هر دو صورت با هم بحث میکنند. «من فکر میکنم علم اعصاب میتواند هر از چند گاهی به عنوان یک نقطه بازرسی اعتبار عمل کند. بچه ها در مسیر درستی هستید؟ آیا در این مورد، مدل های زبانی مناسبی را ایجاد می کنید؟ یا اینکه آنها کاملاً با روشی که مغز در حال حل مسائل است متفاوت است؟
صرف نظر از این، نگاه کردن بیشتر به مغز برای اینکه بفهمید چگونه مسائل را حل می کند، پروژه ای است که باید همه را مورد علاقه خود قرار دهد. به نظر میرسد که یادگیری ماشینی ممکن است یکی از بهترین ابزارهای موجود برای کمک به ما در انجام این کار باشد.
های فن تک از شما دعوت می کند نظرات خود را در مورد این مقاله به اشتراک بگذارید