روش جدید برای رمزگشایی سیستم های یادگیری ماشینی

یک روش جدید به طور خودکار، به زبان طبیعی، کارهایی را که تک تک اجزای یک شبکه عصبی انجام می‌دهند، توصیف می‌کند، برای اینکه بدانید چگونه این عمل صورت می گیرد تا اتمام این مطلب با های فن تک همراه باشید.

شبکه‌های عصبی گاهی اوقات جعبه سیاه نامیده می‌شوند، زیرا علی‌رغم این واقعیت که می‌توانند در انجام برخی وظایف از انسان‌ها بهتر عمل کنند، محققانی که آنها را طراحی می‌کنند نیز اغلب نمی‌دانند که چرا و چگونه آنقدر خوب کار می‌کنند. دانستن اینکه این مدل چگونه کار می‌کند به محققان کمک می‌کند تا پیش‌بینی کنند که چگونه در عمل رفتار خواهد کرد.
البته شاید برای طبقه‌بندی تصاویر پزشکی که می‌تواند به تشخیص بیماری‌های قلبی کمک کند از یک شبکه عصبی در خارج از آزمایشگاه استفاده شود.
محققان MIT اکنون روشی را ابداع کرده‌اند که عملکرد درونی شبکه‌های عصبی یا همان جعبه سیاه روشن می‌شود. شبکه‌های عصبی که از مغز انسان مدل‌سازی شده‌اند، در لایه‌هایی از گره‌های به هم پیوسته یا «نورون‌ها» که داده‌ها را پردازش می‌کنند، مرتب شده‌اند. سیستم جدید می‌تواند به‌طور خودکار توصیفی از آن سلول‌های عصبی منفرد را که به زبان انگلیسی یا یک زبان طبیعی دیگر تولید شده‌اند، ارائه دهد.
به عنوان مثال، در یک شبکه عصبی آموزش دیده برای تشخیص حیوانات در تصاویر، روش آنها ممکن است نورون خاصی را به عنوان تشخیص گوش روباه توصیف کند. تکنیک مقیاس پذیر آنها نسبت به روش های دیگر قادر است توضیحات دقیق تر و مشخص تری را برای نورون های فردی ایجاد کند. این روش می‌تواند برای ممیزی یک شبکه عصبی برای تعیین آنچه که یاد گرفته است، یا حتی ویرایش یک شبکه با شناسایی و سپس خاموش کردن نورون‌های غیرمفید یا نادرست مورد استفاده قرار گیرد.
محققان میخواستند روشی ایجاد کنند که در آن یک متخصص یادگیری ماشینی بتواند مدل خود را به این سیستم بدهد و همه چیزهایی را که درباره آن مدل می‌داند، از منظر نورون‌های مدل، به زبان به آنها بگوید. ایوان هرناندز، دانشجوی فارغ التحصیل در آزمایشگاه علوم کامپیوتر و هوش مصنوعیMIT (CSAIL) می‌گوید: «آیا مدل من چیزی د ر آن مورد می‌داند که من انتظار نداشته باشم آن را بداند؟»

Describing Neural Networks With Natural Language 777x518

توصیفات تولید شده به صورت خودکار
بسیاری از تکنیک‌های موجود که به متخصصان یادگیری ماشینی کمک می‌کنند تا بفهمند یک مدل چگونه کار می‌کند، یا کل شبکه عصبی را توصیف می‌کند یا از محققان می‌خواهد مفاهیمی را که فکر می‌کنند نورون‌های منفرد می‌توانند روی آن تمرکز کنند، شناسایی کنند.
سیستمی که هرناندز و همکارانش توسعه دادند، با نام MILAN (اطلاعات متقابل حاشیه‌شناختی زبانی نورون‌ها)، این روش‌ها را بهبود می‌بخشد، زیرا به فهرستی از مفاهیم از قبل نیاز ندارد و می‌تواند به طور خودکار توصیف زبان طبیعی همه نورون‌های یک شبکه را ایجاد کند. . این امر به ویژه مهم است زیرا یک شبکه عصبی می تواند صدها هزار نورون جداگانه را در خود جای دهد.
MILAN توصیفی از نورون‌ها در شبکه‌های عصبی ارائه می‌دهد که برای کارهای بینایی کامپیوتری مانند تشخیص اشیا و سنتز تصویر آموزش دیده‌اند. برای توصیف یک نورون معین، سیستم ابتدا رفتار آن نورون را بر روی هزاران تصویر بررسی می‌کند تا مجموعه مناطق تصویری را که نورون در آن‌ها فعال‌تر است را بیابد. سپس، یک توصیف زبان طبیعی برای هر نورون انتخاب می‌کند تا کمیتی به نام اطلاعات متقابل نقطه‌ای بین مناطق و توضیحات تصویر را به حداکثر برساند. این توصیفی را تشویق می کند که نقش متمایز هر نورون را در شبکه بزرگتر نشان دهد.
در یک شبکه عصبی که برای طبقه بندی تصاویر آموزش دیده است، تعداد زیادی نورون مختلف وجود دارد که سگ ها را تشخیص می دهد. اما انواع مختلفی از سگ ها و تعداد زیادی از قسمت های مختلف سگ وجود دارد. بنابراین اگرچه «سگ» ممکن است توصیف دقیقی از بسیاری از این نورون‌ها باشد، اما چندان آموزنده نیست. محققان توصیفاتی می خواهند که بسیار خاص به آنچه آن نورون انجام می دهد باشد.
تیم MILAN را با مدل‌های دیگر مقایسه کرد و متوجه شد که توصیف‌های کاملتر و دقیق‌تری ارائه می‌کند، اما محققان بیشتر علاقه‌مند بودند ببینند چگونه می‌تواند در پاسخ به سؤالات خاص در مورد مدل‌های بینایی رایانه کمک می کند.


تجزیه و تحلیل، حسابرسی و ویرایش شبکه های عصبی
اول، آنها از MILAN برای تجزیه و تحلیل اینکه کدام نورون ها در شبکه عصبی مهم هستند استفاده کردند. آنها توضیحاتی را برای هر نورون ایجاد کردند و آنها را بر اساس کلمات موجود در توضیحات مرتب کردند. آنها به آرامی نورون ها را از شبکه حذف کردند تا ببینند که چگونه دقت آن تغییر کرده است و دریافتند که نورون هایی که دو کلمه بسیار متفاوت در توصیف خود دارند (مثلاً گلدان ها و فسیل ها) برای شبکه اهمیت کمتری دارند.
محققان همچنین از MILAN برای ممیزی مدل ها استفاده کردند تا ببینند آیا چیز غیرمنتظره ای یاد گرفته اند. آنها مدل‌های طبقه‌بندی تصویر را انتخاب کردند که بر روی مجموعه‌های داده‌ای آموزش داده شده بود که در آن صورت انسان‌ها تار می‌شد، و بر روی آن MILAN را اجرا کردند و تعداد نورون‌هایی را که با این وجود به صورت انسان حساس بودند، شمارش کردند.
تار کردن چهره‌ها به این روش، تعداد نورون‌هایی را که به چهره‌ها حساس هستند، کاهش می‌دهد، اما آنها را حذف نمی‌کند. در حقیقت، ما فرض می‌کنیم که برخی از این نورون‌های چهره نسبت به گروه‌های جمعیتی خاص بسیار حساس هستند، که همین امر بسیار شگفت‌انگیز است. هرناندز می‌گوید: «این مدل‌ها قبلاً هرگز چهره انسانی ندیده‌اند، و با این حال همه انواع پردازش‌های صورت در داخل آنها اتفاق می‌افتد.»
در آزمایش سوم، این تیم از MILAN برای ویرایش یک شبکه عصبی با یافتن و حذف نورون‌هایی که همبستگی‌های بد را در داده‌ها تشخیص می‌دادند، استفاده کردند، که منجر به افزایش 5 درصدی دقت شبکه در ورودی‌هایی شد که همبستگی مشکل‌زا را نشان می‌دهند.
درست است که که محققان از عملکرد MILAN در این سه برنامه تحت تأثیر قرار گرفتند، اما این مدل گاهی اوقات توصیفاتی را ارائه می دهد که خیلی مبهم هستند، یا زمانی که مفهومی را که باید شناسایی کند، حدس نادرست می زند. به همین دلیل محققان در حال برنامه ریزی برای رسیدگی به این محدودیت ها در کارهای آینده هستند.
این تیم تحقیقاتی همچنین می‌خواهند، توصیفات کاملی را که میلان می‌تواند ایجاد کند، ادامه دهند. آنها امیدوارند که MILAN را در انواع دیگر شبکه های عصبی به کار ببرند و از آن برای توصیف کارهایی که گروه های عصبی انجام می دهند استفاده کنند، چراکه نورون ها با هم کار می کنند تا خروجی تولید کنند.
هدف این است که توصیفات ترکیبی و پایان باز از عملکرد با زبان طبیعی تولید شود. به گفته محققان، آنها می خواهند از قدرت بیانی زبان انسان بهره ببرند تا توصیف‌هایی تولید کنند که برای آنچه نورون‌ها انجام می‌دهند بسیار طبیعی‌تر و کاملتر باشد.


های فن تک از شما دعوت می کند نظرات خود را در مورد این مقاله به اشتراک بگذارید


چاپ