کارتهای گرافیک سری RTX 40 انویدیا تا چند هفته دیگر وارد بازار میشوند، اما در میان تمام پیشرفتهای سختافزاری آن چیزی است که میتواند تخم طلایی انویدیا باشد: DLSS 3 . این بسیار بیشتر از یک بهروزرسانی برای ویژگی محبوب DLSS (نمونهگیری فوقالعاده یادگیری عمیق) انویدیا است و میتواند نسل بعدی انویدیا را بسیار بیشتر از خود کارتهای گرافیک تعریف کند.
AMD سخت کار کرده است تا FidelityFX Super Resolution (FSR) خود را با DLSS برابری کند و در چند ماه گذشته موفق بوده است. به نظر میرسد DLSS 3 این پویایی را تغییر میدهد – و این بار، FSR ممکن است به این زودیها نتواند به آن برسد.
DLSS 3 چگونه کار می کند (و چگونه نمی کند)
اگر فکر می کنید DLSS 3 یک نسخه کاملاً جدید از DLSS است، بخشیده می شوید، اما اینطور نیست. یا حداقل، کاملاً جدید نیست. ستون فقرات DLSS 3 همان فناوری با وضوح فوق العاده است که امروزه در عناوین DLSS موجود است و Nvidia احتمالاً به بهبود آن با نسخه های جدید ادامه خواهد داد. انویدیا میگوید اکنون بخش وضوح فوقالعاده DLSS 3 را بهعنوان یک گزینه جداگانه در تنظیمات گرافیکی مشاهده خواهید کرد.
قسمت جدید تولید فریم است. DLSS 3 در هر فریم دیگر یک فریم کاملا منحصر به فرد ایجاد می کند، که اساساً از هر هشت پیکسلی که می بینید، هفت پیکسل تولید می کند. شما می توانید تصویری از آن را در نمودار جریان زیر مشاهده کنید. در مورد 4K، GPU شما فقط پیکسل ها را برای 1080p رندر می کند و از این اطلاعات نه تنها برای فریم فعلی بلکه برای فریم بعدی نیز استفاده می کند.
بر اساس گفته های انویدیا، تولید فریم، یک تغییر جدا از وضوح فوق العاده خواهد بود. دلیلش این است که در حال حاضر تولید فریم فقط بر روی پردازندههای گرافیکی سری RTX 40 کار میکند، در حالی که وضوح فوقالعاده روی تمام کارتهای گرافیک RTX، حتی در بازیهایی که به DLSS 3 بهروزرسانی شدهاند، به کار خود ادامه خواهد داد. فریمها کاملاً تولید میشوند، که عملکرد شما را بسیار افزایش میدهد.
با این حال، تولید فریم فقط نوعی سس مخفی هوش مصنوعی نیست. در DLSS 2 و ابزارهایی مانند FSR ، بردارهای حرکتی ورودی کلیدی برای ارتقاء مقیاس هستند. آنها مکان حرکت اجسام از یک فریم به فریم دیگر را توصیف می کنند، اما بردارهای حرکتی فقط برای هندسه در یک صحنه اعمال می شوند. عناصری که هندسه سه بعدی ندارند، مانند سایهها، انعکاسها و ذرات، به طور سنتی برای جلوگیری از ایجاد مصنوعات بصری، از فرآیند افزایش مقیاس پوشانده میشوند.
هنگامی که یک هوش مصنوعی یک فریم کاملا منحصر به فرد ایجاد می کند، پوشش دادن گزینه ای نیست، جایی که شتاب دهنده جریان نوری در پردازنده های گرافیکی سری RTX 40 وارد عمل می شود. این مانند یک بردار حرکتی است، با این تفاوت که کارت گرافیک حرکت تک تک پیکسل ها را از یک فریم به فریم دیگر ردیابی می کند. این میدان جریان نوری، همراه با بردارهای حرکت، عمق و رنگ، به فریم تولید شده توسط هوش مصنوعی کمک می کند.
همه چیز مثبت به نظر می رسد، اما یک مشکل بزرگ با فریم های تولید شده توسط هوش مصنوعی وجود دارد: آنها تاخیر را افزایش می دهند. فریم تولید شده توسط هوش مصنوعی هرگز از رایانه شما عبور نمی کند – این یک فریم "جعلی" است، بنابراین شما آن را در بازخوانی های فریم بر ثانیه سنتی در بازی ها یا ابزارهایی مانند FRAPS نخواهید دید. بنابراین، با وجود داشتن تعداد زیادی فریم اضافی، تأخیر کاهش نمییابد، و به دلیل سربار محاسباتی جریان نوری، تأخیر در واقع بالا میرود. به همین دلیل، DLSS 3 به Nvidia Reflex نیاز دارد تا تأخیر بالاتر را جبران کند.
به طور معمول، CPU شما یک صف رندر برای کارت گرافیک شما ذخیره می کند تا مطمئن شود GPU شما هرگز منتظر کار نیست (که باعث لکنت و افت نرخ فریم می شود). Reflex صف رندر را حذف می کند و GPU و CPU شما را همگام می کند تا به محض اینکه CPU شما بتواند دستورالعمل ها را ارسال کند، GPU شروع به پردازش آنها می کند. هنگامی که در بالای DLSS 3 اعمال می شود، انویدیا می گوید که Reflex گاهی اوقات حتی می تواند منجر به کاهش تاخیر شود.
جایی که هوش مصنوعی تفاوت ایجاد می کند
AMD FSR 2.0 از هوش مصنوعی استفاده نمی کند، و همانطور که مدتی قبل نوشتم، ثابت می کند که می توانید به جای یادگیری ماشینی ، کیفیت DLSS را با الگوریتم ها دریافت کنید. DLSS 3 با قابلیت های منحصربفرد تولید فریم و همچنین معرفی جریان نوری آن را تغییر می دهد.
جریان نوری ایده جدیدی نیست – دهه هاست که وجود دارد و در همه چیز از برنامه های ویرایش ویدئو گرفته تا ماشین های خودران کاربرد دارد. با این حال، محاسبه جریان نوری با یادگیری ماشین به دلیل افزایش مجموعه دادهها برای آموزش مدلهای هوش مصنوعی نسبتاً جدید است. دلیل اینکه شما می خواهید از هوش مصنوعی استفاده کنید ساده است: با توجه به آموزش کافی، خطاهای بصری کمتری ایجاد می کند و در زمان اجرا سربار زیادی ندارد.
DLSS در زمان اجرا در حال اجرا است. این امکان وجود دارد که الگوریتمی بدون یادگیری ماشینی برای تخمین چگونگی حرکت هر پیکسل از یک فریم به فریم دیگر ایجاد کرد، اما از نظر محاسباتی گران است، که در وهله اول با کل سوپرنمونهبرداری مغایرت دارد. با یک مدل هوش مصنوعی که به اسب بخار زیاد و داده های آموزشی کافی نیاز ندارد – و مطمئن باشید، Nvidia داده های آموزشی زیادی برای کار با آنها دارد – می توانید به جریان نوری با کیفیت بالا دست پیدا کنید و در زمان اجرا قابل اجرا باشد.
این منجر به بهبود نرخ فریم حتی در بازی هایی می شود که CPU محدود هستند. Supersampling فقط برای وضوح شما اعمال می شود که تقریباً منحصراً به GPU شما بستگی دارد. با یک فریم جدید که پردازش CPU را دور میزند، DLSS 3 میتواند نرخ فریم را در بازیها دو برابر کند، حتی اگر گلوگاه کامل CPU داشته باشید. این چشمگیر است و در حال حاضر فقط با هوش مصنوعی امکان پذیر است.
چرا FSR 2.0 نمی تواند به آن برسد (در حال حاضر)
AMD واقعاً غیرممکن را با FSR 2.0 انجام داده است. فوق العاده به نظر می رسد، و این واقعیت که برند-آگنوستیک است حتی بهتر است. از زمانی که برای اولین بار آن را در Deathloop دیدم، آماده حذف DLSS برای FSR 2.0 هستم. اما به همان اندازه که از FSR 2.0 لذت می برم و فکر می کنم این یک کیت عالی از AMD است، به این زودی ها به DLSS 3 نمی رسد.
برای شروع، توسعه الگوریتمی که بتواند هر پیکسل را بین فریمهای بدون آرتیفکت ردیابی کند، به اندازه کافی سخت است، به خصوص در یک محیط سه بعدی با جزئیات دقیق متراکم ( Cyberpunk 2077 یک مثال بارز است). ممکن است، اما سخت است. با این حال، مسئله بزرگتر این است که این الگوریتم چقدر باید پف کرده باشد. ردیابی هر پیکسل از طریق فضای سه بعدی، انجام محاسبات جریان نوری، تولید یک فریم، و پاک کردن هر گونه اتفاق ناگواری که در طول مسیر اتفاق می افتد – سوال زیادی است.
اجرای آن در حالی که بازی در حال اجرا است و هنوز هم بهبود نرخ فریم در سطح FSR 2.0 یا DLSS را ارائه می دهد، حتی بیشتر از آن باید پرسید. انویدیا، حتی با پردازندههای اختصاصی و یک مدل آموزشدیده، همچنان مجبور است از Reflex برای جبران تأخیر بیشتر ناشی از جریان نوری استفاده کند. بدون آن سختافزار یا نرمافزار، FSR احتمالاً تاخیر زیادی برای تولید فریمها دارد.
من شک ندارم که AMD و سایر توسعه دهندگان در نهایت به آنجا خواهند رسید – یا راه دیگری برای حل مشکل پیدا خواهند کرد – اما این ممکن است چند سال بعد باشد. در حال حاضر گفتنش سخت است.
چیزی که به راحتی می توان گفت این است که DLSS 3 بسیار هیجان انگیز به نظر می رسد. البته، باید منتظر بمانیم تا به اینجا برسد تا ادعاهای عملکرد انویدیا را تایید کنیم و ببینیم کیفیت تصویر چگونه حفظ میشود. تا کنون، ما فقط یک ویدیوی کوتاه از Digital Foundry داریم که فیلمهای DLSS 3 را نشان میدهد (در بالا)، که من به شدت توصیه میکنم تا زمانی که آزمایشهای شخص ثالث بیشتری را ببینیم، آن را تماشا کنید. با این حال، از نقطه نظر فعلی ما، DLSS 3 مطمئنا امیدوارکننده به نظر می رسد.
این مقاله بخشی از ReSpec است – یک ستون دوهفتهای در حال انجام که شامل بحثها، توصیهها و گزارشهای عمیق در مورد فناوری بازیهای رایانه شخصی است.