آخرین تلاش متا در تولید تصویر هوش مصنوعی سریع است. این شرکت مدل جدید "3D Gen" خود را در روز سهشنبه معرفی کرد ، یک خط لوله پیشرفته و سریع برای تبدیل متن ورودی به تصاویر سهبعدی با کیفیت بالا که میتواند در کمتر از یک دقیقه آنها را خروجی دهد.
علاوه بر این، طبق گزارشها، این سیستم میتواند با استفاده از اعلانهای متنی، بافتها و پوستههای جدید را بر روی تصاویر تولید شده و تولید شده توسط هنرمند اعمال کند.
طبق مطالعه اخیر تیم تحقیقاتی Meta Gen AI، 3D Gen نه تنها بافتها و نقشههای مواد با وضوح بالا را ارائه میکند، بلکه از قابلیتهای رندر مبتنی بر فیزیکی (PBR) و قابلیتهای بافتسازی مجدد نیز پشتیبانی میکند.
تحقیق جدید از GenAI در Meta، معرفی Meta 3D Gen: یک سیستم جدید برای تولید سرتاسر داراییهای سه بعدی از متن در مدت <1 دقیقه.
Meta 3D Gen یک سیستم ترکیبی هوش مصنوعی جدید است که میتواند داراییهای سه بعدی با کیفیت بالا را با بافتهای با وضوح بالا و نقشههای مواد به صورت سرتاسر تولید کند،… pic.twitter.com/rDD5GzNinY
— هوش مصنوعی در متا (@AIatMeta) 2 ژوئیه 2024
این تیم میانگین زمان استنتاج را تنها 30 ثانیه در ایجاد مدل سه بعدی اولیه با استفاده از مدل 3D AssetGen متا تخمین می زند. سپس کاربران میتوانند به عقب برگردند و بافت مدل موجود را اصلاح کنند یا آن را با چیزی جدید جایگزین کنند، هر دو از طریق پیامهای متنی، با استفاده از Meta 3D TextureGen، فرآیندی که طبق برآورد شرکت نباید بیش از 20 ثانیه زمان استنتاج اضافی طول بکشد.
این تیم در چکیده مطالعه خود نوشت: "با ترکیب نقاط قوت آنها، 3DGen اشیاء سه بعدی را به طور همزمان به سه روش نشان می دهد: در فضای دید، در فضای حجمی و در فضای UV (یا بافت). تیم متا مدل 3D Gen خود را با تعدادی از خطوط پایه صنعت تنظیم کرد و با عوامل مختلفی از جمله وفاداری متن، کیفیت بصری، جزئیات بافت و مصنوعات مقایسه کرد. با ترکیب عملکردهای هر دو مدل، تصاویر تولید شده توسط فرآیند دو مرحله ای یکپارچه توسط حاشیه نویسان نسبت به همتایان تک مرحله ای خود در 68 درصد مواقع انتخاب شدند.
مسلماً، سیستم مورد بحث در این مقاله هنوز در حال توسعه است و هنوز برای استفاده عمومی آماده نیست، اما پیشرفتهای فنی که این مطالعه نشان میدهد میتواند در تعدادی از رشتههای خلاق، از جلوههای بازی و فیلم گرفته تا کاربردهای VR، دگرگونکننده باشد.
دادن توانایی نه تنها به کاربران برای ایجاد، بلکه ویرایش محتوای تولید شده توسط سه بعدی، هم به سرعت و هم به صورت شهودی، میتواند به شدت مانع ورود به چنین کارهایی را کاهش دهد . به عنوان مثال، تصور تأثیری که می تواند بر توسعه بازی داشته باشد، سخت نیست.