هوش مصنوعی جدید OpenAI: تبدیل متن به ویدئو با ابزار Sora !

شرکت OpenAI خالق چت بات معروف ChatGPT دوباره خبرساز شد!!!

SORAابزار تبدیل متن به تصویر

شرکت آمریکایی OpenAI سال گذشته را به لطف چت بات محبوب ChatGPT طوفانی شروع کرد. این شرکت پنجشنبه گذشته از ابزار هوش مصنوعی جدید تبدیل متن به ویدئو خود رونمایی کرد. سارا شبیه به ابزار DALL-E عمل می کند و به کاربران امکان می‌دهد با کمک هوش مصنوعی، ویدئوهای خلاقانه و با کیفیت بالا بسازند.

فقط کافی است کاربر یک جمله در مورد تصویر مورد نظر خود تایپ کند! Sora براساس متن کاربر یک کلیپ ویدئویی با وضوح تصویر بالا تولید می کند و به کاربر نمایش می دهد. این ابزار حتی می تواند با استفاده از تصاویر ثابت، یک کلیپ ویدئویی بسازد یا فریم تصاویر از دست رفته را با این تصاویر پر کند.

هوش مصنوعی مولد به سرعت در حال پیشرفت است و راه خود را برای ورود به دنیای مصرف‌کنندگان و تجارت پیدا کرده است. چت‌بات‌ها و ابزارهای تولید تصویر مانند DALL-E نمونه‌هایی از این نوع چت بات ها هستند. این فناوری شاید برای علاقه مندان به هوش مصنوعی جالب باشد اما، با نزدیک شدن به زمان برگزاری بزرگترین انتخابات ریاست جمهوری جهان نگرانی های زیادی را در مورد انتشار اطلاعات نادرست به وجود اورده است. طبق آمار شرکت Clarity تعداد تصاویر جعلی ایجاد شده توسط هوش مصنوعی سالانه 900 درصد افزایش می یابد.
OpenAI به تازگی تصمیم گرفت برای رقابت با ابزارهای هوش مصنوعی تولید تصاویر ویدئویی شرکت هایی مانند Lumiere متا و گوگل یا Stable Video Diffusion شرکت دانش بنیان Stability AI و Create with Alexa شرکت آمازون؛ ابزاری به نام Sora بسازد. این ابزار در حال حاضر می تواند ویدئوهای یک دقیقه ای یا کمتر بسازد. اما جاه طلبی های شرکت سام آلتمن به همین جا خاتمه پیدا نمی کند. این شرکت با پشتیبانی مایکروسافت در حال توسعه‌ی مدل‌های هوش مصنوعی جدیدی است که می‌توانند متن، تصویر و ویدئو را به طور همزمان تولید کنند. هدف اصلی آنها، ارائه مجموعه‌ بزرگتری از هوش مصنوعی با کاربردهای مختلف است.

برد لایت کپ، مدیر اجرایی OpenAI در مورد هوش مصنوعی چندوجهی می گوید: «ما انسان‌ها دنیا را با تمام حواسمان تجربه می‌کنیم. این حواس فقط محدود به خواندن و نوشتن نمی شود. پس هوش مصنوعی هم باید به همین صورت عمل کند. مدل‌های هوش مصنوعی فعلی که فقط روی متن و کد تمرکز دارند، کامل نیستند. به همین علت OpenAI در حال توسعه‌ی مدل‌های جدیدی است که بتواند متن، تصویر و ویدئو را به طور همزمان پردازش کنند . هدف ما از انجام این کار، ساخت یک هوش مصنوعی قدرتمندتر و خلاقانه تری است که بتواند در دنیای واقعی کاربردهای بیشتری داشته باشد.»

در حال حاضر، ابزار Sora فقط برای تعداد محدودی از آزمایش‌کنندگان ایمنی یا تیم های امنیتی قابل دسترسی است. وظیفه این تیم ها بررسی نقاط آسیب پذیری در زمینه اطلاعات نادرست و سوگیری های هوش مصنوعی است. این شرکت تعداد کمی کلیپ تصویری در مورد نحوه کار این ابزار در وب سایت رسمی خود منتشر کرد. OpenAI به موازات آن، مشغول ساخت ابزاری جدید برای تشخیص ویدئوهای تولید شده توسط هوش مصنوعی است. این ابزار که "طبقه‌بندی تشخیص " یا “detection classifier” نام دارد، می تواند ویدئوهای ساخته شده توسط Sora را شناسایی کند.

ابزار Sora مانند ChatGPT براساس معماری Transformer ساخته شده است که توسط محققان گوگل در سال 2017 معرفی شده بود. OpenAI در بیانیه رسمی خود نوشت:"مدل هوش مصنوعی Sora می تواند پایه واساس مدل هایی شود که می خواهند دنیای واقعی را درک و شبیه سازی کنند."


چاپ