DLSS 3 Nvidia چگونه کار می کند (و چرا AMD FSR در حال حاضر نمی تواند به آن برسد)

کارت‌های گرافیک سری RTX 40 انویدیا تا چند هفته دیگر وارد بازار می‌شوند، اما در میان تمام پیشرفت‌های سخت‌افزاری آن چیزی است که می‌تواند تخم طلایی انویدیا باشد: DLSS 3 . این بسیار بیشتر از یک به‌روزرسانی برای ویژگی محبوب DLSS (نمونه‌گیری فوق‌العاده یادگیری عمیق) انویدیا است و می‌تواند نسل بعدی انویدیا را بسیار بیشتر از خود کارت‌های گرافیک تعریف کند.

AMD سخت کار کرده است تا FidelityFX Super Resolution (FSR) خود را با DLSS برابری کند و در چند ماه گذشته موفق بوده است. به نظر می‌رسد DLSS 3 این پویایی را تغییر می‌دهد – و این بار، FSR ممکن است به این زودی‌ها نتواند به آن برسد.

DLSS 3 چگونه کار می کند (و چگونه نمی کند)

نموداری که نحوه عملکرد فناوری DLSS 3 انویدیا را نشان می دهد.
Nvidia

اگر فکر می کنید DLSS 3 یک نسخه کاملاً جدید از DLSS است، بخشیده می شوید، اما اینطور نیست. یا حداقل، کاملاً جدید نیست. ستون فقرات DLSS 3 همان فناوری با وضوح فوق العاده است که امروزه در عناوین DLSS موجود است و Nvidia احتمالاً به بهبود آن با نسخه های جدید ادامه خواهد داد. انویدیا می‌گوید اکنون بخش وضوح فوق‌العاده DLSS 3 را به‌عنوان یک گزینه جداگانه در تنظیمات گرافیکی مشاهده خواهید کرد.

قسمت جدید تولید فریم است. DLSS 3 در هر فریم دیگر یک فریم کاملا منحصر به فرد ایجاد می کند، که اساساً از هر هشت پیکسلی که می بینید، هفت پیکسل تولید می کند. شما می توانید تصویری از آن را در نمودار جریان زیر مشاهده کنید. در مورد 4K، GPU شما فقط پیکسل ها را برای 1080p رندر می کند و از این اطلاعات نه تنها برای فریم فعلی بلکه برای فریم بعدی نیز استفاده می کند.

نموداری که نشان می دهد چگونه DLSS 3 فریم ها را بازسازی می کند.
Nvidia

بر اساس گفته های انویدیا، تولید فریم، یک تغییر جدا از وضوح فوق العاده خواهد بود. دلیلش این است که در حال حاضر تولید فریم فقط بر روی پردازنده‌های گرافیکی سری RTX 40 کار می‌کند، در حالی که وضوح فوق‌العاده روی تمام کارت‌های گرافیک RTX، حتی در بازی‌هایی که به DLSS 3 به‌روزرسانی شده‌اند، به کار خود ادامه خواهد داد. فریم‌ها کاملاً تولید می‌شوند، که عملکرد شما را بسیار افزایش می‌دهد.

با این حال، تولید فریم فقط نوعی سس مخفی هوش مصنوعی نیست. در DLSS 2 و ابزارهایی مانند FSR ، بردارهای حرکتی ورودی کلیدی برای ارتقاء مقیاس هستند. آنها مکان حرکت اجسام از یک فریم به فریم دیگر را توصیف می کنند، اما بردارهای حرکتی فقط برای هندسه در یک صحنه اعمال می شوند. عناصری که هندسه سه بعدی ندارند، مانند سایه‌ها، انعکاس‌ها و ذرات، به طور سنتی برای جلوگیری از ایجاد مصنوعات بصری، از فرآیند افزایش مقیاس پوشانده می‌شوند.

نموداری که از طریق DLSS 3 Nvidia حرکت می کند.
Nvidia

هنگامی که یک هوش مصنوعی یک فریم کاملا منحصر به فرد ایجاد می کند، پوشش دادن گزینه ای نیست، جایی که شتاب دهنده جریان نوری در پردازنده های گرافیکی سری RTX 40 وارد عمل می شود. این مانند یک بردار حرکتی است، با این تفاوت که کارت گرافیک حرکت تک تک پیکسل ها را از یک فریم به فریم دیگر ردیابی می کند. این میدان جریان نوری، همراه با بردارهای حرکت، عمق و رنگ، به فریم تولید شده توسط هوش مصنوعی کمک می کند.

همه چیز مثبت به نظر می رسد، اما یک مشکل بزرگ با فریم های تولید شده توسط هوش مصنوعی وجود دارد: آنها تاخیر را افزایش می دهند. فریم تولید شده توسط هوش مصنوعی هرگز از رایانه شما عبور نمی کند – این یک فریم "جعلی" است، بنابراین شما آن را در بازخوانی های فریم بر ثانیه سنتی در بازی ها یا ابزارهایی مانند FRAPS نخواهید دید. بنابراین، با وجود داشتن تعداد زیادی فریم اضافی، تأخیر کاهش نمی‌یابد، و به دلیل سربار محاسباتی جریان نوری، تأخیر در واقع بالا می‌رود. به همین دلیل، DLSS 3 به Nvidia Reflex نیاز دارد تا تأخیر بالاتر را جبران کند.

به طور معمول، CPU شما یک صف رندر برای کارت گرافیک شما ذخیره می کند تا مطمئن شود GPU شما هرگز منتظر کار نیست (که باعث لکنت و افت نرخ فریم می شود). Reflex صف رندر را حذف می کند و GPU و CPU شما را همگام می کند تا به محض اینکه CPU شما بتواند دستورالعمل ها را ارسال کند، GPU شروع به پردازش آنها می کند. هنگامی که در بالای DLSS 3 اعمال می شود، انویدیا می گوید که Reflex گاهی اوقات حتی می تواند منجر به کاهش تاخیر شود.

جایی که هوش مصنوعی تفاوت ایجاد می کند

AMD FSR 2.0 از هوش مصنوعی استفاده نمی کند، و همانطور که مدتی قبل نوشتم، ثابت می کند که می توانید به جای یادگیری ماشینی ، کیفیت DLSS را با الگوریتم ها دریافت کنید. DLSS 3 با قابلیت های منحصربفرد تولید فریم و همچنین معرفی جریان نوری آن را تغییر می دهد.

جریان نوری ایده جدیدی نیست – دهه هاست که وجود دارد و در همه چیز از برنامه های ویرایش ویدئو گرفته تا ماشین های خودران کاربرد دارد. با این حال، محاسبه جریان نوری با یادگیری ماشین به دلیل افزایش مجموعه داده‌ها برای آموزش مدل‌های هوش مصنوعی نسبتاً جدید است. دلیل اینکه شما می خواهید از هوش مصنوعی استفاده کنید ساده است: با توجه به آموزش کافی، خطاهای بصری کمتری ایجاد می کند و در زمان اجرا سربار زیادی ندارد.

DLSS در زمان اجرا در حال اجرا است. این امکان وجود دارد که الگوریتمی بدون یادگیری ماشینی برای تخمین چگونگی حرکت هر پیکسل از یک فریم به فریم دیگر ایجاد کرد، اما از نظر محاسباتی گران است، که در وهله اول با کل سوپرنمونه‌برداری مغایرت دارد. با یک مدل هوش مصنوعی که به اسب بخار زیاد و داده های آموزشی کافی نیاز ندارد – و مطمئن باشید، Nvidia داده های آموزشی زیادی برای کار با آنها دارد – می توانید به جریان نوری با کیفیت بالا دست پیدا کنید و در زمان اجرا قابل اجرا باشد.

این منجر به بهبود نرخ فریم حتی در بازی هایی می شود که CPU محدود هستند. Supersampling فقط برای وضوح شما اعمال می شود که تقریباً منحصراً به GPU شما بستگی دارد. با یک فریم جدید که پردازش CPU را دور می‌زند، DLSS 3 می‌تواند نرخ فریم را در بازی‌ها دو برابر کند، حتی اگر گلوگاه کامل CPU داشته باشید. این چشمگیر است و در حال حاضر فقط با هوش مصنوعی امکان پذیر است.

چرا FSR 2.0 نمی تواند به آن برسد (در حال حاضر)

مقایسه کیفیت تصویر FSR و DLSS در God of War.

AMD واقعاً غیرممکن را با FSR 2.0 انجام داده است. فوق العاده به نظر می رسد، و این واقعیت که برند-آگنوستیک است حتی بهتر است. از زمانی که برای اولین بار آن را در Deathloop دیدم، آماده حذف DLSS برای FSR 2.0 هستم. اما به همان اندازه که از FSR 2.0 لذت می برم و فکر می کنم این یک کیت عالی از AMD است، به این زودی ها به DLSS 3 نمی رسد.

برای شروع، توسعه الگوریتمی که بتواند هر پیکسل را بین فریم‌های بدون آرتیفکت ردیابی کند، به اندازه کافی سخت است، به خصوص در یک محیط سه بعدی با جزئیات دقیق متراکم ( Cyberpunk 2077 یک مثال بارز است). ممکن است، اما سخت است. با این حال، مسئله بزرگ‌تر این است که این الگوریتم چقدر باید پف کرده باشد. ردیابی هر پیکسل از طریق فضای سه بعدی، انجام محاسبات جریان نوری، تولید یک فریم، و پاک کردن هر گونه اتفاق ناگواری که در طول مسیر اتفاق می افتد – سوال زیادی است.

اجرای آن در حالی که بازی در حال اجرا است و هنوز هم بهبود نرخ فریم در سطح FSR 2.0 یا DLSS را ارائه می دهد، حتی بیشتر از آن باید پرسید. انویدیا، حتی با پردازنده‌های اختصاصی و یک مدل آموزش‌دیده، همچنان مجبور است از Reflex برای جبران تأخیر بیشتر ناشی از جریان نوری استفاده کند. بدون آن سخت‌افزار یا نرم‌افزار، FSR احتمالاً تاخیر زیادی برای تولید فریم‌ها دارد.

من شک ندارم که AMD و سایر توسعه دهندگان در نهایت به آنجا خواهند رسید – یا راه دیگری برای حل مشکل پیدا خواهند کرد – اما این ممکن است چند سال بعد باشد. در حال حاضر گفتنش سخت است.

چیزی که به راحتی می توان گفت این است که DLSS 3 بسیار هیجان انگیز به نظر می رسد. البته، باید منتظر بمانیم تا به اینجا برسد تا ادعاهای عملکرد انویدیا را تایید کنیم و ببینیم کیفیت تصویر چگونه حفظ می‌شود. تا کنون، ما فقط یک ویدیوی کوتاه از Digital Foundry داریم که فیلم‌های DLSS 3 را نشان می‌دهد (در بالا)، که من به شدت توصیه می‌کنم تا زمانی که آزمایش‌های شخص ثالث بیشتری را ببینیم، آن را تماشا کنید. با این حال، از نقطه نظر فعلی ما، DLSS 3 مطمئنا امیدوارکننده به نظر می رسد.

این مقاله بخشی از ReSpec است – یک ستون دوهفته‌ای در حال انجام که شامل بحث‌ها، توصیه‌ها و گزارش‌های عمیق در مورد فناوری بازی‌های رایانه شخصی است.