IBM یک هوش مصنوعی را ساخته است که می تواند خود را برای مناظره در برابر انسان حفظ کند
در طول چند سال گذشته ، هوش مصنوعی توانسته بیشتر از کارهای انسان را بهتر از خود آن انجام دهد.. هوش مصنوعی می تواند کیفیت صوتی و تصویری را بهبود بخشد ، تصاویر ساکن افراد طولانی مدت را متحرک کند و شما را از روی یک اثر تجزیه و تحلیل کند. یک کاری نتوانسته است انجام دهد و آن نیز در مناظرهی رسمی با انسان عملکرد قابل قبولی داشته باشد.
برای غلبه بر این مشکل ، IBM Project Debater را ایجاد کرد ، یک برنامه توسعه هوش مصنوعی دقیقاً روی آنچه که به نظر می رسد متمرکز است. بسیاری از پروژه های هوش مصنوعی ، به ویژه آنهایی که روی بازی تمرکز دارند ، بر اساس ارزیابی معیارهای عددی مانند قطعات ضبط شده ، زندگی از دست رفته یا نسبت بین مرگ و میر ، یک برنده و یک بازنده دارند. بحث و گفتگوی موثر درباره یک انسان نیاز به یک مجموعه مهارت کاملا متفاوت دارد.
مقاله اخیر در مجله Nature نتایج یک آزمایش که در سال 2019 بین Project Debater و قهرمان بحث در سطح جهانی ، Harish Natarajan برگزار شد. در این آزمایش، هوش مصنوعی و انسان دربارهی اینکه آیا باید پیشدبستانی مشمول یارانه شود یا خیر با یکدیگر مناظره کردند. هر سمت مناظره ۱۵ دقیقه وقت داشت بدون دسترسی به اینترنت، خود را برای بحث آماده کند که Project Debater در این مدت، محتوای ذخیرهشده در دیتابیس داخلی خود را بررسی کرد. هر دو طرف چهار دقیقه دربارهی موضوع بحث صحبت کردند و دو دقیقه هم به جمعبندی اختصاص داشت.
در نمودار زیر ، "Summit" یک سیستم خلاصه چند سند است ، Speech-GPT2 "یک مدل زبان دقیق تنظیم شده" است ، و Arg-GPT2 با استفاده از استدلال های متقابل ایجاد شده است. Arg-Search به سخنرانیهایی اشاره میکند که از فناوری استخراج استدلال ArgumenTextH اشاره دارد. Arg-Human1 و Arg-Human2 به روشی ترکیبی اشاره دارند که ماژول استخراج استدلال Project Debater را در کنار تأیید و تأیید انسانی آزمایش می کند. آخرین ستون مربوط به سخنرانیهایی است که مستقیما از کارشناسان انسانی به دست آمده.
نمودار بالا نمره پایه را نشان می دهد که نمره 5 نشان دهنده "کاملاً موافقم" و نمره 1 به معنی "کاملاً مخالف" است. از نظر خوانندگان، جملهای که هوش مصنوعی Debater برای شروع مناظره مطرح کرده بود، از نظر تناسب با موضوع بحث، فاصلهی چندانی با جملات کارشناسان انسانی نداشت. این نمودار تنها قابلیت این پروژهی هوش مصنوعی را در طرح جملات آغازین مناظره ارزیابی میکند؛ اما در این حد نشان میدهد که این سیستم قادر است در مناظرات، استدلالهای منسجم و منطقی مطرح کند.
البته این سوال که چه کسی در یک بحث پیروز می شود همیشه ذهنی خواهد بود و انسان ها هنوز به وضوح از IBM’s Project Debater پیشی می گیرند. اما نمیتوان پیشرفت چشمگیر بشر را در حوزهی هوش مصنوعی، از زمان پروژهی پردازش زبان طبیعی Eliza (که توانست برای اولین بار تست تورینگ را با موفقیت پشت سر بگذارد) تا به امروز انکار کرد.