یک روش جدید به طور خودکار، به زبان طبیعی، کارهایی را که تک تک اجزای یک شبکه عصبی انجام میدهند، توصیف میکند، برای اینکه بدانید چگونه این عمل صورت می گیرد تا اتمام این مطلب با های فن تک همراه باشید.
شبکههای عصبی گاهی اوقات جعبه سیاه نامیده میشوند، زیرا علیرغم این واقعیت که میتوانند در انجام برخی وظایف از انسانها بهتر عمل کنند، محققانی که آنها را طراحی میکنند نیز اغلب نمیدانند که چرا و چگونه آنقدر خوب کار میکنند. دانستن اینکه این مدل چگونه کار میکند به محققان کمک میکند تا پیشبینی کنند که چگونه در عمل رفتار خواهد کرد.
البته شاید برای طبقهبندی تصاویر پزشکی که میتواند به تشخیص بیماریهای قلبی کمک کند از یک شبکه عصبی در خارج از آزمایشگاه استفاده شود.
محققان MIT اکنون روشی را ابداع کردهاند که عملکرد درونی شبکههای عصبی یا همان جعبه سیاه روشن میشود. شبکههای عصبی که از مغز انسان مدلسازی شدهاند، در لایههایی از گرههای به هم پیوسته یا «نورونها» که دادهها را پردازش میکنند، مرتب شدهاند. سیستم جدید میتواند بهطور خودکار توصیفی از آن سلولهای عصبی منفرد را که به زبان انگلیسی یا یک زبان طبیعی دیگر تولید شدهاند، ارائه دهد.
به عنوان مثال، در یک شبکه عصبی آموزش دیده برای تشخیص حیوانات در تصاویر، روش آنها ممکن است نورون خاصی را به عنوان تشخیص گوش روباه توصیف کند. تکنیک مقیاس پذیر آنها نسبت به روش های دیگر قادر است توضیحات دقیق تر و مشخص تری را برای نورون های فردی ایجاد کند. این روش میتواند برای ممیزی یک شبکه عصبی برای تعیین آنچه که یاد گرفته است، یا حتی ویرایش یک شبکه با شناسایی و سپس خاموش کردن نورونهای غیرمفید یا نادرست مورد استفاده قرار گیرد.
محققان میخواستند روشی ایجاد کنند که در آن یک متخصص یادگیری ماشینی بتواند مدل خود را به این سیستم بدهد و همه چیزهایی را که درباره آن مدل میداند، از منظر نورونهای مدل، به زبان به آنها بگوید. ایوان هرناندز، دانشجوی فارغ التحصیل در آزمایشگاه علوم کامپیوتر و هوش مصنوعیMIT (CSAIL) میگوید: «آیا مدل من چیزی د ر آن مورد میداند که من انتظار نداشته باشم آن را بداند؟»
توصیفات تولید شده به صورت خودکار
بسیاری از تکنیکهای موجود که به متخصصان یادگیری ماشینی کمک میکنند تا بفهمند یک مدل چگونه کار میکند، یا کل شبکه عصبی را توصیف میکند یا از محققان میخواهد مفاهیمی را که فکر میکنند نورونهای منفرد میتوانند روی آن تمرکز کنند، شناسایی کنند.
سیستمی که هرناندز و همکارانش توسعه دادند، با نام MILAN (اطلاعات متقابل حاشیهشناختی زبانی نورونها)، این روشها را بهبود میبخشد، زیرا به فهرستی از مفاهیم از قبل نیاز ندارد و میتواند به طور خودکار توصیف زبان طبیعی همه نورونهای یک شبکه را ایجاد کند. . این امر به ویژه مهم است زیرا یک شبکه عصبی می تواند صدها هزار نورون جداگانه را در خود جای دهد.
MILAN توصیفی از نورونها در شبکههای عصبی ارائه میدهد که برای کارهای بینایی کامپیوتری مانند تشخیص اشیا و سنتز تصویر آموزش دیدهاند. برای توصیف یک نورون معین، سیستم ابتدا رفتار آن نورون را بر روی هزاران تصویر بررسی میکند تا مجموعه مناطق تصویری را که نورون در آنها فعالتر است را بیابد. سپس، یک توصیف زبان طبیعی برای هر نورون انتخاب میکند تا کمیتی به نام اطلاعات متقابل نقطهای بین مناطق و توضیحات تصویر را به حداکثر برساند. این توصیفی را تشویق می کند که نقش متمایز هر نورون را در شبکه بزرگتر نشان دهد.
در یک شبکه عصبی که برای طبقه بندی تصاویر آموزش دیده است، تعداد زیادی نورون مختلف وجود دارد که سگ ها را تشخیص می دهد. اما انواع مختلفی از سگ ها و تعداد زیادی از قسمت های مختلف سگ وجود دارد. بنابراین اگرچه «سگ» ممکن است توصیف دقیقی از بسیاری از این نورونها باشد، اما چندان آموزنده نیست. محققان توصیفاتی می خواهند که بسیار خاص به آنچه آن نورون انجام می دهد باشد.
تیم MILAN را با مدلهای دیگر مقایسه کرد و متوجه شد که توصیفهای کاملتر و دقیقتری ارائه میکند، اما محققان بیشتر علاقهمند بودند ببینند چگونه میتواند در پاسخ به سؤالات خاص در مورد مدلهای بینایی رایانه کمک می کند.
تجزیه و تحلیل، حسابرسی و ویرایش شبکه های عصبی
اول، آنها از MILAN برای تجزیه و تحلیل اینکه کدام نورون ها در شبکه عصبی مهم هستند استفاده کردند. آنها توضیحاتی را برای هر نورون ایجاد کردند و آنها را بر اساس کلمات موجود در توضیحات مرتب کردند. آنها به آرامی نورون ها را از شبکه حذف کردند تا ببینند که چگونه دقت آن تغییر کرده است و دریافتند که نورون هایی که دو کلمه بسیار متفاوت در توصیف خود دارند (مثلاً گلدان ها و فسیل ها) برای شبکه اهمیت کمتری دارند.
محققان همچنین از MILAN برای ممیزی مدل ها استفاده کردند تا ببینند آیا چیز غیرمنتظره ای یاد گرفته اند. آنها مدلهای طبقهبندی تصویر را انتخاب کردند که بر روی مجموعههای دادهای آموزش داده شده بود که در آن صورت انسانها تار میشد، و بر روی آن MILAN را اجرا کردند و تعداد نورونهایی را که با این وجود به صورت انسان حساس بودند، شمارش کردند.
تار کردن چهرهها به این روش، تعداد نورونهایی را که به چهرهها حساس هستند، کاهش میدهد، اما آنها را حذف نمیکند. در حقیقت، ما فرض میکنیم که برخی از این نورونهای چهره نسبت به گروههای جمعیتی خاص بسیار حساس هستند، که همین امر بسیار شگفتانگیز است. هرناندز میگوید: «این مدلها قبلاً هرگز چهره انسانی ندیدهاند، و با این حال همه انواع پردازشهای صورت در داخل آنها اتفاق میافتد.»
در آزمایش سوم، این تیم از MILAN برای ویرایش یک شبکه عصبی با یافتن و حذف نورونهایی که همبستگیهای بد را در دادهها تشخیص میدادند، استفاده کردند، که منجر به افزایش 5 درصدی دقت شبکه در ورودیهایی شد که همبستگی مشکلزا را نشان میدهند.
درست است که که محققان از عملکرد MILAN در این سه برنامه تحت تأثیر قرار گرفتند، اما این مدل گاهی اوقات توصیفاتی را ارائه می دهد که خیلی مبهم هستند، یا زمانی که مفهومی را که باید شناسایی کند، حدس نادرست می زند. به همین دلیل محققان در حال برنامه ریزی برای رسیدگی به این محدودیت ها در کارهای آینده هستند.
این تیم تحقیقاتی همچنین میخواهند، توصیفات کاملی را که میلان میتواند ایجاد کند، ادامه دهند. آنها امیدوارند که MILAN را در انواع دیگر شبکه های عصبی به کار ببرند و از آن برای توصیف کارهایی که گروه های عصبی انجام می دهند استفاده کنند، چراکه نورون ها با هم کار می کنند تا خروجی تولید کنند.
هدف این است که توصیفات ترکیبی و پایان باز از عملکرد با زبان طبیعی تولید شود. به گفته محققان، آنها می خواهند از قدرت بیانی زبان انسان بهره ببرند تا توصیفهایی تولید کنند که برای آنچه نورونها انجام میدهند بسیار طبیعیتر و کاملتر باشد.
های فن تک از شما دعوت می کند نظرات خود را در مورد این مقاله به اشتراک بگذارید