NVIDIA DLSS 3.5 Ray Reconstruction – Recenzja nowej techniki
NVIDIA DLSS 3.5 Ray Reconstruction
Spis treści
DLSS 3.5 wraz z nową funkcją odtwarzania promieni (Ray Reconstruction) to najnowsze innowacje, które NVIDIA wprowadziła na rynek gier komputerowych, rozpoczynając od technologii NVIDIA RTX. DLSS 3.5 Ray Reconstruction ma nadzieję znacząco poprawić jakość gier z promieniowaniem, tak aby wyświetlany obraz wyglądał nawet lepiej niż natywna rozdzielczość. Firma oficjalnie wprowadza dziś DLSS 3.5 Ray Reconstruction, z tytułem pilotowym Cyberpunk 2077 Phantom Liberty. NVIDIA pracuje nad rozszerzeniem tej funkcji na dziesiątki tytułów, zarówno wydanych, jak i będących w trakcie rozwoju.
Kiedy zadebiutował obok GeForce RTX serii 20, DLSS, czyli Deep Learning Super Sampling, nie zdobyło takiej uwagi jak ray tracing, ale cicho zyskiwało na popularności jako najbardziej poszukiwana funkcja w GPU GeForce RTX. DLSS 2 (super próbkowanie) sprawia, że Twoja gra renderowana jest w niższej rozdzielczości niż jest to możliwe na twoim ekranie, a wykorzystuje specjalistyczny algorytm upscalingu oparty na sztucznej inteligencji, aby odtworzyć szczegóły w rozdzielczości wyjściowej. Różne presety jakości określają rozdzielczość, w jakiej faktycznie jest renderowana gra. Ponieważ gra jest renderowana w niższej rozdzielczości, osiąga się niemal liniowy wzrost liczby klatek na sekundę. DLSS 3 Frame Generation dodał nowy wymiar do zestawu funkcji DLSS. Dostępne w GPU serii RTX 40, Frame Generation konstruuje całkowicie alternatywne ramki całkowicie za pomocą sztucznej inteligencji, bez angażowania potoku renderowania grafiki, niemal podwajając liczbę klatek na sekundę przy dowolnej rozdzielczości.
DLSS 3.5 Ray Reconstruction dodaje kolejną możliwość, w której NVIDIA próbuje pokonać utratę jakości wynikającą z DLSS 2 Super Resolution w ray tracingu. Technologia ta oferuje doskonałą alternatywę nawet dla natywnego denoisera NVIDIA, istotnego elementu nowoczesnego potoku ray tracingu. Czysty ray tracing w interaktywnym 3D pozostaje świętym graalem technologii graficznych, to, co mamy teraz, to połączenie grafiki 3D w technologii rastrowej z elementami ray tracingu, nawet te małe fragmenty ray tracingu są niezwykle intensywne obliczeniowo, dlatego jest śledzona mniejsza liczba promieni niż potrzebna do dokładności fizycznej, a denoiser próbuje kompensować ich rozproszenie. Bez denoisingu, obraz ray tracingowy wydawałby się posiadać warstwę białego lub czarnego szumu spowodowanego brakującymi promieniami.
W przeciwieństwie do DLSS 3 Frame Generation, który wymaga kart graficznych Ada serii GeForce RTX 40, DLSS 3.5 Ray Reconstruction działa na wszystkich kartach graficznych GeForce RTX, w tym Turing serii RTX 20, Ampere serii RTX 30 i Ada serii RTX 40. Technologia Ray Reconstruction spełnia wszystkie wymagania sprzętowe w starszych generacjach GeForce RTX, nie ma korzyści z posiadania najnowszej serii RTX 40, poza lepszą wydajnością. Jest to inaczej niż w przypadku DLSS 3 Frame Generation, który wymaga, aby GPU miała komponent Optical Flow Accelerator wprowadzony przez NVIDIĘ w Ada. Łatwiejszym sposobem na zrozumienie tego jest nie traktowanie DLSS 2, DLSS 3 i DLSS 3.5 jako wersji chronologicznych, ale przypisywanie im ich cech – Super Resolution (SR) dla DLSS 2, Frame Generation (FG) dla DLSS 3 i Ray Reconstruction (RR) dla DLSS 3.5.
Cyberpunk 2077 Phantom Liberty jest pierwszą grą, która wdrożyła DLSS 3.5 Ray Reconstruction, jeszcze w tym roku dołączą do niej Alan Wake II i Portal RTX. Biorąc pod uwagę NVIDIĘ, prawdopodobnie współpracuje z każdym studiem gier, które wdrożyło DLSS i ray tracing, aby spróbować wdrożyć Ray Reconstruction w ich aktualnych tytułach. W tej recenzji dokładnie przyjrzymy się, co oferuje wizualnie DLSS 3.5 Ray Reconstruction i jak wpływa na wydajność, na wybranych kartach graficznych z trzech generacji GeForce RTX.
Jak aktywować DLSS 3.5 w grze Cyberpunk 2077 Phantom Liberty
- W grze Cyberpunk 2077 znajdziesz przełącznik w sekcji „NVIDIA DLSS”.
- Aby pojawiła się ta opcja, musisz najpierw włączyć DLSS Super Resolution, dowolny tryb jakości lub „auto” będzie odpowiedni.
- Obecnie włączenie DLAA nie da Ci opcji włączenia Ray Reconstruction, ale to coś, nad czym NVIDIA pracuje.
- DLSS 3 Frame Generation można włączyć lub wyłączyć, oba tryby obsługują Ray Reconstruction.
- Gdy jest włączone standardowe śledzenie promieni, przełącznik Ray Reconstruction będzie nieaktywny.
- Aby przełącznik stał się aktywny, musisz najpierw aktywować śledzenie ścieżek (Path Tracign). Potwierdziłem to z firmą NVIDIA, że z technicznego punktu widzenia Ray Reconstruction może działać również z klasycznym śledzeniem promieni (bez śledzenia ścieżek), ale korzyści będą mniej imponujące wizualnie.
- Podobnie jak DLSS Frame Generation, DLSS Ray Reconstruction jest dostarczany w formie pliku DLL, który znajduje się w katalogu gry. Nosi on nazwę „nvngx_dlssd.dll”. Cyberpunk 2077 jest dostarczany z wersją 3.5.0.0 tego pliku DLL.
DLSS 3.5 Ray Reconstruction – zasada działania
Z DLSS 3.5 NVIDIA wprowadza nowy denoiser śledzenia promieni, który jest zoptymalizowany do współpracy z technologią skalowania DLSS 2, aby zapewnić lepszą jakość obrazu, która jest jednocześnie bardziej poprawna. Ta funkcja opiera się na rdzeniach tensorowych (a nie rdzeniach RT, o to pytaliśmy), więc jest dostępna na wszystkich kartach graficznych GeForce RTX (Turing i nowszych).
W nowoczesnych silnikach gier ray tracing działa w następujący sposób: w pierwszym kroku silnik tworzy geometrię i materiały, ale bez żadnego cieniowania. Te informacje są wykorzystywane do utworzenia struktury przyspieszającej BVH do śledzenia promieni, co pomaga określić, gdzie promienie przecinają geometrię świata. Następnie zostaje wysłane wiele promieni, a ich ścieżka jest śledzona, aby obliczyć przecięcia, ewentualnie pozwolić im odbić się, być może nawet kilka razy. Wyniki te są teraz przekazywane do denoisera, który zamienia pojedyncze piksele na ciągły obraz, który wygląda jak śledzenie promieni w odbiciu, cieniach, oświetleniu. Z włączonym skalowaniem, denoiser generuje wynik w niższej rozdzielczości renderowania, a nie ostatecznej rozdzielczości natywnej – denoiser nie jest nawet świadomy ostatecznej rozdzielczości. Ponadto inny problem polega na tym, że upscaler nie wie nic o promieniach, widzi tylko wyjście pikselowe z denoisera – wszystkie oryginalne wartości śledzenia promieni są tracone na tym etapie.
Największym problemem z denoiserami jest to, że polegają one na poprzednich klatkach, aby „zbierać” wystarczającą ilość danych pikselowych do końcowego obrazu. Oznacza to, że wynik RT to średnia kilku poprzednich klatek. Powyższy slajd opisuje takie problematyczne przypadki. Na przykład lustro na ruchomym samochodzie jest łączone przez kilka klatek, co prowadzi do efektów widma. Innym problemem są subtelne efekty oświetlenia i odbicia, które wyglądają jak rozmazane.
Innowacją NVIDIA w przypadku DLSS 3.5 jest połączenie procesu denoisingu i upscalingu w jednym wspólnym kroku, który ma więcej dostępnych informacji, co obiecuje wyższą jakość obrazu wyjściowego. Niskiej rozdzielczości obraz jest łączony z wynikiem z rasteryzacji, krokami ray tracingu i wektorami ruchu, a wszystko jest bezpośrednio nanoszone na obraz o dużej rozdzielczości, w tym przypadku 4K. Algorytm DLSS 3.5 uwzględnia również poprzednie klatki (opóźnienia czasowe), tak jak DLSS 2. Po zakończeniu upscalingu następuje kolejny przebieg dla funkcji DLSS 3 Frame Generation (jeśli jest włączona).
DLSS 3.5 Ray Reconstruction – porównanie grafiki
Teraz przyjrzyjmy się działaniu DLSS 3.5 Ray Reconstruction. Wszystkie te zrzuty ekranu zostały wykonane na RTX 4090, przy maksymalnych ustawieniach, z włączonym path tracingiem. Rozmycie ruchu, ziarno filmowe i podobne efekty były wyłączone.
DLSS 3.5 Ray Reconstruction – wydajność & obciążenie VRAM
DLSS 3.5 Ray Reconstruction – Podsumowanie
DLSS 3.5 Ray Reconstruction to kolejny element układanki w historii DLSS firmy NVIDIA. To, co zaczęło się od zwykłego upscalingu, stało się całą ekosferą funkcji poprawiających jakość obrazu i wydajność dla graczy. Na początku mieliśmy tylko „DLSS”, czyli Super Resolution, która bierze wejście w niższej rozdzielczości i skaluje je lepiej niż klasyczne skalowanie. Trochę później dodano „DLAA”, czyli DLSS Upscaling bez skalowania. Tutaj algorytmy poprawy obrazu pracują na wejściu o natywnej rozdzielczości, co oznacza brak artefaktów związanego z upscalingiem, a jednocześnie dostajesz wszystkie dobrodziejstwa anty-aliasingu! Wraz z premierą GeForce 40, wprowadzono „DLSS 3” Frame Generation, który patrzy na dwa obrazy i tworzy trzeci „środkowy” obraz, na którym rzeczy, które zmieniły się między dwoma wejściami, przemieściły się tylko na pół drogi. Daje to znacznie wyższą liczbę klatek na sekundę, bez obciążania renderingu CPU/GPU – działa nawet przy ograniczeniach CPU.
Dziś debiutuje technologia NVIDIA DLSS 3.5 Ray Reconstruction, najpierw w Cyberpunk 2077, ale wiele innych gier jest w przygotowaniu. Z perspektywy dewelopera, rzeczy wyglądają znacznie bardziej podzielone. Teraz są trzy pliki DLL do implementacji DLSS: nvngx_dlss.dll, który zawiera Super Resolution (i DLAA), nvngx_dlssg.dll, do generowania klatek, oraz nvngx_dlssd.dll do Ray Reconstruction. Te technologie są dość niezależne, co tłumaczy również wymagania sprzętowe. Podczas gdy Super Resolution działa na wszystkich GPU GeForce 20 i nowszych, generacja klatek wymaga GeForce 40, ale Ray Reconstruction działa na GeForce 20 i nowszych, tak samo jak Super Resolution. To nie oznacza, że DLSS 3.5 magicznie włącza generację klatek dla starszych GPU. Według NVIDII, generacja klatek wymaga jednostki akceleratora przepływu optycznego w GPU Ada. AMD ogłosiło FSR 3, technologię generowania klatek opartą na shaderach – będzie interesujące zobaczyć, jak dobrze działa zarówno pod względem jakości obrazu, jak i wydajności.
Dzisiaj wszystko kręci się wokół rekonstrukcji promieni. Przeprowadziliśmy obszerne testy nowej technologii NVIDII i muszę przyznać, że jestem pod wrażeniem. Przez lata widzieliśmy odbicia śledzone promieniowo, które wyglądają ziarniste i rozmazane, ale akceptowaliśmy to jako „tak musi być, bo inaczej wydajność ucierpi (jeszcze bardziej)”. NVIDIA nie była zadowolona z tego wyjaśnienia, więc długo i intensywnie myślała o tym problemie, i wymyśliła rozwiązanie wykraczające poza utarte schematy. Zamiast rzucać więcej promieni na problem, Ray Reconstruction wykorzystuje dodatkowe informacje dostępne w silniku gry, ale utracone w pewnym momencie w procesie renderowania, ponieważ kolejne etapy renderowania pracują z mniejszą ilością informacji. Spójrz na nasze porównawcze zrzuty ekranu – naprawdę jest znacząca różnica w końcowym efekcie. Muszę przyznać, że szczególnie w ruchu i podczas intensywnej rozgrywki te różnice nie są zbyt zauważalne, ale uważam, że poprawiają one nieco jakość obrazu, dlatego wydaje się odpowiednie nazwanie tego „DLSS 3.5” zamiast „DLSS 4.0”. To nie tylko odbicia wyglądają na ostrzejsze, jest znacząca poprawa cieni, zwłaszcza jeśli chodzi o drobne detale. Gdy promienie są śledzone, często „omijają” detale o małej strukturze, ponieważ po prostu nie ma wystarczającej liczby promieni, aby próbkować tę strukturę. Dzięki Ray Reconstruction te obiekty są znacznie lepiej rozdzielane, a cienie wyglądają na bardziej ostre i szczegółowe. Zauważyliśmy także poprawę oświetlenia otoczenia, które wygląda nieco bardziej realistycznie. Klasyczne denoisery agregują informacje z wielu klatek, co oznacza, że niektóre ruchome obiekty, takie jak reflektory samochodu w ruchu, stają się rozmazane – dzięki RR reflektory są ostre i wyraźne. To samo dzieje się, gdy źródło odbicia szybko miga – klasyczne denoisery często uśredniają ten efekt lub pokazują go z krótkim opóźnieniem.
Niestety Ray Reconstruction nie jest obsługiwane z DLAA ani przy renderowaniu w natywnej rozdzielczości. NVIDIA potwierdziła, że będą szkolić RR dla DLAA w przyszłości. Co więcej, moim zdaniem jeszcze bardziej problematyczne jest to, że obecnie Ray Reconstruction działa tylko z włączonym śledzeniem promieni. To ogranicza dostęp do technologii do bardzo niewielu graczy – praktycznie tych z RTX 4080 lub RTX 4090. Wszyscy inni będą grać z klasycznym śledzeniem promieni lub nawet wyłączonym RT. Z technicznego punktu widzenia nic nie stoi na przeszkodzie, żeby Ray Reconstruction działał z klasycznymi efektami śledzenia promieni. W chwili obecnej Ray Reconstruction będzie dostępny tylko dla niewielkiej grupy odbiorców, ale kiedy NVIDIA rozwiąże te dwa problemy, stanie się to przełomem dla RT w grach. Uważam również, że AMD będzie w stanie zaimplementować podobną technologię dla FSR, co może nawet pomóc im uzyskać dodatkową wydajność.
W trakcie testów zauważyłem, że obraz z Ray Reconstruction wydaje się nieco jaśniejszy, a niektóre powierzchnie wyglądają trochę wyblakłe – NVIDIA powinna być w stanie szybko to naprawić. Moje największe trudności związane z testami Ray Reconstruction pojawiły się podczas konfigurowania ustawień gry w Cyberpunku. Z jakiegoś powodu gra lubi mieszać w ustawieniach. Włączasz FG? Oto „DLSS Auto”, który idzie z nim w parze, niezależnie od wyboru „DLSS Quality”. O, włączasz DLSS? W takim razie naprawdę chcemy, żebyś zobaczył działanie RR, oto i on, nie mam pojęcia, dlaczego wyłączyłeś go wcześniej. Ponownie, niczego CDPR nie może naprawić, ale widzieliśmy już wiele takich przypadków, w których deweloperzy gier źle konfigurują swoje menu pod kątem istotnych technik graficznych, być może z powodu braku czasu lub zrozumienia. Przynajmniej CDPR dobrze dostosowało suwaki ostrości. Posiadanie wszystkich tych technologii do dyspozycji na pewno jest trudne, dlatego uważam, że Microsoft powinien podjąć wysiłek w celu unifikacji tych technologii pod szyldem DirectX, tak samo jak to zrobił z ray tracingiem. To uczyniłoby sprawy jasne dla wszystkich zainteresowanych stron i prawdopodobnie zwiększyłoby wskaźniki przyjęcia tych technologii.
Ciekawym odkryciem jest to, że Ray Reconstruction faktycznie obniża użycie pamięci VRAM. Na przykład przy rozdzielczości 4K zmierzyliśmy 11,8 GB z wyłączonym RR, a tylko 10,9 GB z włączonym RR. Jedna możliwa teoria zakłada, że domyślny denoiser (który jest zastępowany przez RR) ma wyższe użycie pamięci, być może dlatego, że przechowuje więcej ramek historii w buforze. Co również może pomóc, to to, że RR jest zintegrowany z przejściem DLSS Super Resolution, co oznacza, że niektóre bufory można współdzielić i nie zostaną zduplikowane.
Jeśli chodzi o wydajność, NVIDIA była ostrożna w swoich twierdzeniach. Oficjalne przekazy mówią, że to technika poprawiająca jakość obrazu, wydajność może być podobna, nieznacznie lepsza lub nieznacznie gorsza. W naszych testach zauważyliśmy wzrost wydajności ogólnie, zwłaszcza dla Ada i Ampere. Na przykład RTX 4090 przy rozdzielczości 4K bez Frame Generation wzrósł z 49 klatek na sekundę do 53 klatek na sekundę. Przetestowałem kilka lokalizacji i nie mogłem znaleźć ani jednej, w której wydajność zmalała po włączeniu RR. To dobre wieści – nowa funkcja NVIDIA nie tylko wygląda lepiej, ale także poprawia wydajność.
Źródło artykułu: TPU