تبدیل تصاویر دو بعدی به سه بعدی در عرض 5 ثانیه!

تحریریه هوش مصنوعی 21 آبان 1402 بازدید: 98

محققان موفق شدند مدل هوش مصنوعی جدیدی ارائه دادند که می تواند در عرض 5 دقیقه تصاویر دو بعدی را تبدیل به تصاویر سه بعدی کند.

هوش مصنوعی تصویر

محققان شرکت Adobe با همکاری دانشگاه ملی استرالیا با استفاده از یک مجموعه داده ای بزرگ، الگوریتم یادگیری ماشینی ایجاد کردند که می تواند تصاویر سه بعدی بسازد. اولین مدل بازسازی بزرگ (LRM) می تواند از روی تصویر دو بعدی، تصاویر سه بعدی آن را در عرض 5 ثانیه بسازد.

ابزار جدید چه کمکی به ما می کند؟! صنعت خلاق تبلیغات نیاز به تولید محتوای مداوم برای جذب مخاطب دارد. پس باید این محتوا به گونه ای تولید شود. از طرف دیگر وقتی صحبت از مدل‌های سه بعدی می کنیم، الگوریتم‌های هوش مصنوعی می توانند زمان تولید این تصاویر را خیلی کوتاه کنند. تیم تحقیقاتی در اینجا از مدل های سه‌بعدی قبلی برای آموزش مجموعه کوچکی از تصاویر استفاده کردند. آنها LRM را در این مطالعه براساس حدود 1 میلیون شی 3 بعدی از مجموعه داده های Objaverse و MVImgNet اموزش دادند.
LRM از یک مدل یادگیری ماشینی با ظرفیت بالا و مجموعه ای از داده های بزرگ استفاده می کند. این روش به دلیل ترکیب این دو ویژگی، قابلیت ایجاد محتوای «بسیار قابل تعمیم» را دارد. به زبان ساده تر، LRM می تواند تصاویر بازسازی شده سه بعدی دقیق و با کیفیتی را از روی مجموعه بزرگی از تصاویر دو بعدی انجام دهد.

نتایج نشان داد که LRM می تواند بازسازی های سه بعدی با کیفیتی را از روی تصاویر آزمایشی یا تصاویر دنیای واقعی تولید کند. علاوه بر این، LRM توانست هم تصاویر «عادی» و هم تصاویر تولید شده توسط هوش مصنوعی مانند DALL-E و Stable Diffusion را به عنوان مدل دوبعدی از ورودی دریافت کند.

به گفته Yicong Hong ، نویسنده اصلی این مطالعه؛ LRM یک پیشرفت مهم در بازسازی سه بعدی تصاویر معمولی است. الگوریتم هوش مصنوعی جدید می تواند مدل دقیقی را از روی یک ویدیو یا یک تصویر با حفظ جزئیات آن بازسازی کند. این فناوری فرآیند مدل‌سازی سه‌بعدی را ساده‌تر می کنند و علاوه براین، زمان مورد نیاز برای تولید بازی‌های ویدیویی یا انیمیشن‌ها را به‌طور قابل توجهی کاهش می دهد. تولید محتوای سه بعدی در صنعت طراحی امروزه به یک چالش تبدیل شده است و شرکت های هوش مصنوعی سعی دارند با ارائه روش هایی مانند سرویس Stable 3D که اخیرا توسط Stability AI معرفی شده است، راه حلی برای آن پیدا کنند.

LRM می تواند مدل سازی سه بعدی را دموکراتیزه کند. به عبارت ساده تر، این روش می تواند دسترسی به مدل سازی سه بعدی را برای کاربران عادی راحت تر و آسان تر کند. در گذشته، مدل سازی سه بعدی تحت یک فرآیند بسیار پیچیده تولید می شد که به دانش و مهارت خاصی نیاز داشت. اما، با استفاده از این مدل زبان بزرگ کاربران عادی می توانند مدل های سه بعدی دقیق و با کیفیتی را از روی عکس هایی که با گوشی هوشمند خود گرفته اند، ایجاد کنند.

LRM هنوز با چالش هایی مانند وجود بافت های تار در قسمت های پنهان یک تصویر مواجه است. این چالش ها می توانند باعث تولید مدل های سه بعدی بی کیفیتی شود. با این حال، محققان معتقدند که این چالش ها قابل حل هستند.این روش می تواند در زمینه های ذیل کاربرد داشته باشد:

• بازسازی واقعیت مجازی و واقعیت افزوده
• بازی سازی
• معماری
• فیلم سازی
• عکاسی