هوش مصنوعی IBM؛ موفق در مناظره رسمی با انسان

IBM یک هوش مصنوعی را ساخته است که می تواند خود را برای مناظره در برابر انسان حفظ کند

در طول چند سال گذشته ، هوش مصنوعی توانسته بیشتر از کارهای انسان را بهتر از خود آن انجام دهد.. هوش مصنوعی می تواند کیفیت صوتی و تصویری را بهبود بخشد ، تصاویر ساکن افراد طولانی مدت را متحرک کند و شما را از روی یک اثر تجزیه و تحلیل کند. یک کاری نتوانسته است انجام دهد و آن نیز در مناظره‌ی رسمی با انسان عملکرد قابل‌ قبولی داشته باشد.
برای غلبه بر این مشکل ، IBM Project Debater را ایجاد کرد ، یک برنامه توسعه هوش مصنوعی دقیقاً روی آنچه که به نظر می رسد متمرکز است. بسیاری از پروژه های هوش مصنوعی ، به ویژه آنهایی که روی بازی تمرکز دارند ، بر اساس ارزیابی معیارهای عددی مانند قطعات ضبط شده ، زندگی از دست رفته یا نسبت بین مرگ و میر ، یک برنده و یک بازنده دارند. بحث و گفتگوی موثر درباره یک انسان نیاز به یک مجموعه مهارت کاملا متفاوت دارد.
مقاله اخیر در مجله Nature نتایج یک آزمایش که در سال 2019 بین Project Debater و قهرمان بحث در سطح جهانی ، Harish Natarajan برگزار شد. در این آزمایش، هوش مصنوعی و انسان درباره‌ی اینکه‌‌ آیا باید پیش‌دبستانی مشمول یارانه شود یا خیر با یکدیگر مناظره کردند. هر سمت مناظره ۱۵ دقیقه وقت داشت بدون دسترسی به اینترنت، خود را برای بحث آماده کند که Project Debater در این مدت، محتوای ذخیره‌شده در دیتابیس داخلی خود را بررسی کرد. هر دو طرف چهار دقیقه درباره‌ی موضوع بحث صحبت کردند و دو دقیقه هم به جمع‌بندی اختصاص داشت.
در نمودار زیر ، "Summit" یک سیستم خلاصه چند سند است ، Speech-GPT2 "یک مدل زبان دقیق تنظیم شده" است ، و Arg-GPT2 با استفاده از استدلال های متقابل ایجاد شده است. Arg-Search به سخنرانی‌هایی اشاره می‌کند که از فناوری استخراج استدلال ArgumenTextH اشاره دارد. Arg-Human1 و Arg-Human2 به روشی ترکیبی اشاره دارند که ماژول استخراج استدلال Project Debater را در کنار تأیید و تأیید انسانی آزمایش می کند. آخرین ستون مربوط به سخنرانی‌هایی است که مستقیما از کارشناسان انسانی به دست آمده.

DebateScoring 640x544

نمودار بالا نمره پایه را نشان می دهد که نمره 5 نشان دهنده "کاملاً موافقم" و نمره 1 به معنی "کاملاً مخالف" است. از نظر خوانندگان، جمله‌ای که هوش مصنوعی Debater برای شروع مناظره مطرح کرده بود، از نظر تناسب با موضوع بحث، فاصله‌ی چندانی با جملات کارشناسان انسانی نداشت. این نمودار تنها قابلیت این پروژه‌ی هوش مصنوعی را در طرح جملات آغازین مناظره ارزیابی می‌کند؛ اما در این حد نشان می‌دهد که این سیستم قادر است در مناظرات، استدلال‌های منسجم و منطقی مطرح کند.
البته این سوال که چه کسی در یک بحث پیروز می شود همیشه ذهنی خواهد بود و انسان ها هنوز به وضوح از IBM’s Project Debater پیشی می گیرند. اما نمی‌توان پیشرفت چشم‌گیر بشر را در حوزه‌ی هوش مصنوعی، از زمان پروژه‌ی پردازش زبان طبیعی Eliza (که توانست برای اولین‌ بار تست تورینگ را با موفقیت پشت سر بگذارد) تا به امروز انکار کرد.


چاپ