Nvidia GeForce RTX 5090 – testy, cena

Nowa architektura graficzna GeForce Blackwell wprowadza ulepszenia we wszystkich sześciu kluczowych komponentach GPU. Rdzenie CUDA, czyli główne zunifikowane silniki shaderów GPU, nie tylko wprowadzają generacyjny wzrost IPC, ale zostały również przeprojektowane w celu przyspieszenia shaderów neuronowych. Rdzeń RT 4. generacji, oprócz dalszego obniżania kosztu wydajnościowego ray tracingu w porównaniu z poprzednią generacją, został wyposażony w optymalizację dla mega geometrii – obiektów z ray tracingiem o znacznie bardziej złożonej geometrii (więcej powierzchni, z którymi promienie mogą wchodzić w interakcję). Rdzenie Tensor 5. generacji tworzą podstawy nie tylko dla renderowania neuronowego, ale wprowadzają również obsługę nowszych formatów danych, w tym FP4. NVIDIA wyposażyła wszystkie komponenty związane z przyspieszeniem AI w dedykowany silnik zarządzający o nazwie AMP. Ponadto Blackwell aktualizuje także silniki przyspieszenia mediów oraz wprowadza długo oczekiwaną aktualizację interfejsu we/wy wyświetlacza, z obsługą DisplayPort 2.1 i UHBR20. Wreszcie, Blackwell jest pierwszym GPU wykorzystującym standardy PCI-Express Gen 5 i pamięć GDDR7. We wszystkich aspektach występują znaczące wzrosty przepustowości pamięci.
Co ciekawe, podczas gdy GeForce Blackwell wprowadza innowacje niemal w każdym kierunku, cała linia GPU jest zbudowana na dokładnie tym samym procesie technologicznym co seria RTX 40 generacji Ada – specjalistycznym wariancie 5 nm węzła EUV w TSMC, który został wspólnie opracowany przez tę odlewnię z NVIDIA, nazywanym TSMC 4N. Wszelkie generacyjne zyski w wydajności na wat wynikają wyłącznie z architektury i nowych technologii zarządzania energią wprowadzonych wraz z Blackwell, a nie z samego procesu technologicznego.
Karta graficzna GeForce RTX 5090 jest flagowym produktem firmy w tej generacji i bazuje na gigantycznej, monolitycznej krzemowej strukturze GB202 wykonanej w procesie 5 nm. Model ten wykorzystuje 170 z 192 multiprocesorów strumieniowych (SM) obecnych na układzie, osiągając 21 760 rdzeni CUDA, 170 rdzeni RT, 680 rdzeni Tensor, 680 jednostek TMU i 176 jednostek ROP. Podsystem pamięci przechodzi znaczącą generacyjną aktualizację. Karta jest wyposażona w 32 GB pamięci GDDR7 pracującej z częstotliwością 28 Gbps. NVIDIA poszerzyła magistralę pamięci do 512 bitów, zapewniając RTX 5090 ogromną przepustowość pamięci na poziomie 1,792 TB/s – taką, jakiej można się spodziewać po konfiguracjach HBM w GPU przeznaczonych do AI. Te masywne wzrosty w wielkości i przepustowości pamięci są kluczowe dla GPU, aby mogło realizować ray tracing wysokiej geometrii i renderowanie neuronowe.
NVIDIA nie ograniczyła swojej inżynierii tylko do układu GB202 i różnych technologii programowych, takich jak DLSS 4 i Reflex 2, ale zajęła się również samym produktem. Karta w wersji Founders Edition jest niezwykłym osiągnięciem inżynieryjnym. Jest tak samo długa i wysoka jak RTX 4090 Founders Edition, ale ma tylko dwie trzecie jej grubości (2 sloty zamiast 3 slotów). Jest to możliwe dzięki nowemu rozwiązaniu chłodzenia Double Flow Through, które kompaktuje i przesuwa PCB, tworząc dwa niemal nieograniczone kanały przepływu powietrza dla dwóch wentylatorów karty.
Karta NVIDIA GeForce RTX 5090 Founders Edition jest wyposażona w zbliżone do referencyjnych zegary, z taktowaniem boost GPU na poziomie 2407 MHz i pamięcią 28 Gbps (efektywnie GDDR7). Przy tych ustawieniach całkowity pobór mocy karty graficznej (TGP), stanowiący de facto limit mocy karty, wzrasta aż do 575 W, zbliżając się do limitów projektowych złącza zasilania 12V-2×6 o możliwościach 600 W. NVIDIA wycenia GeForce RTX 5090 Founders Edition na bazową cenę 1999 dolarów amerykańskich. Jest to znaczący wzrost ceny w porównaniu do RTX 4090, który startował od 1599 dolarów.
RTX 5090 – Architektura
![]() | Cena MSRP | Rdzenie CUDA | ROPs | Zegar bazowy | Boost | Taktowanie VRAM | GPU | Ilość tranzystorów | Pamięć |
---|---|---|---|---|---|---|---|---|---|
RTX 3080 | $420 | 8704 | 96 | 1440 MHz | 1710 MHz | 1188 MHz | GA102 | 28000M | 10 GB, GDDR6X, 320-bit |
RTX 4070 | $490 | 5888 | 64 | 1920 MHz | 2475 MHz | 1313 MHz | AD104 | 35800M | 12 GB, GDDR6X, 192-bit |
RX 7800 XT | $440 | 3840 | 96 | 2124 MHz | 2430 MHz | 2425 MHz | Navi 32 | 28100M | 16 GB, GDDR6, 256-bit |
RX 6900 XT | $450 | 5120 | 128 | 2015 MHz | 2250 MHz | 2000 MHz | Navi 21 | 26800M | 16 GB, GDDR6, 256-bit |
RX 6950 XT | $630 | 5120 | 128 | 2100 MHz | 2310 MHz | 2250 MHz | Navi 21 | 26800M | 16 GB, GDDR6, 256-bit |
RTX 3090 | $900 | 10496 | 112 | 1395 MHz | 1695 MHz | 1219 MHz | GA102 | 28000M | 24 GB, GDDR6X, 384-bit |
RTX 4070 Super | $590 | 7168 | 80 | 1980 MHz | 2475 MHz | 1313 MHz | AD104 | 35800M | 12 GB, GDDR6X, 192-bit |
RX 7900 GRE | $530 | 5120 | 160 | 1880 MHz | 2245 MHz | 2250 MHz | Navi 31 | 57700M | 16 GB, GDDR6, 256-bit |
RTX 4070 Ti | $700 | 7680 | 80 | 2310 MHz | 2610 MHz | 1313 MHz | AD104 | 35800M | 12 GB, GDDR6X, 192-bit |
RTX 4070 Ti Super | $750 | 8448 | 112 | 2340 MHz | 2610 MHz | 1313 MHz | AD103 | 45900M | 16 GB, GDDR6X, 256-bit |
RX 7900 XT | $620 | 5376 | 192 | 2000 MHz | 2400 MHz | 2500 MHz | Navi 31 | 57700M | 20 GB, GDDR6, 320-bit |
RTX 3090 Ti | $1000 | 10752 | 112 | 1560 MHz | 1950 MHz | 1313 MHz | GA102 | 28000M | 24 GB, GDDR6X, 384-bit |
RTX 4080 | $940 | 9728 | 112 | 2205 MHz | 2505 MHz | 1400 MHz | AD103 | 45900M | 16 GB, GDDR6X, 256-bit |
RTX 4080 Super | $990 | 10240 | 112 | 2295 MHz | 2550 MHz | 1438 MHz | AD103 | 45900M | 16 GB, GDDR6X, 256-bit |
RX 7900 XTX | $820 | 6144 | 192 | 2300 MHz | 2500 MHz | 2500 MHz | Navi 31 | 57700M | 24 GB, GDDR6, 384-bit |
RTX 4090 | $2400 | 16384 | 176 | 2235 MHz | 2520 MHz | 1313 MHz | AD102 | 76300M | 24 GB, GDDR6X, 384-bit |
RTX 5090 | $2000 | 21760 | 176 | 2017 MHz | 2407 MHz | 1750 MHz | GB202 | 92200M | 32 GB, GDDR7, 512-bit |
MSI RTX 5090 Suprim SOC | $2400 | 21760 | 176 | 2017 MHz | 2512 MHz | 1750 MHz | GB202 | 92200M | 32 GB, GDDR7, 512-bit |
ASUS RTX 5090 Astral OC | $2800 | 21760 | 176 | 2017 MHz | 2580 MHz | 1750 MHz | GB202 | 92200M | 32 GB, GDDR7, 512-bit |
Palit RTX 5090 GameRock | $2200 (??) | 21760 | 176 | 2017 MHz | 2407 MHz | 1750 MHz | GB202 | 92200M | 32 GB, GDDR7, 512-bit |
NVIDIA Blackwell
Architektura graficzna GeForce Blackwell zwiastuje czwartą generację RTX – wynalezionego pod koniec drugiej dekady XXI wieku nowoczesnego GPU, który łączy obiekty renderowane w czasie rzeczywistym przy użyciu ray tracingu z konwencjonalną grafiką rastrową 3D. Wraz z Blackwell, NVIDIA pomaga dodać kolejny wymiar – renderowanie neuronowe, czyli zdolność GPU do wykorzystania sztucznej inteligencji generatywnej do tworzenia części klatki. Jest to inne podejście niż DLSS, gdzie model AI jest wykorzystywany do rekonstrukcji szczegółów w przeskalowanej klatce na podstawie danych treningowych, klatek temporalnych i wektorów ruchu. Sercem testowanej dziś karty GeForce RTX 5090 jest gigantyczny układ GB202 wykonany w procesie 5 nm. Jest to jeden z największych monolitycznych układów krzemowych kiedykolwiek zaprojektowanych przez NVIDIA, o powierzchni 750 mm², w porównaniu do 608,5 mm² układu AD102. Proces technologiczny pozostaje niezmieniony między tymi dwiema generacjami – nadal jest to specyficzny dla NVIDIA wariant TSMC 5 nm EUV, nazwany TSMC 4N. GB202 zawiera 92,2 miliarda tranzystorów, co stanowi 20% wzrost w porównaniu do AD102.

Układ krzemowy GB202 jest zasadniczo rozplanowany w tej samej hierarchii komponentów co poprzednie generacje GPU NVIDIA, ale z kilkoma istotnymi zmianami. GPU wykorzystuje interfejs PCI-Express 5.0 x16, co czyni go pierwszym GPU dla graczy z taką funkcjonalnością. PCIe Gen 5 jest dostępny od czasu procesorów Intel 12. generacji Core „Alder Lake” i AMD Ryzen 7000 „Zen 4”, istnieje więc znacząca baza zainstalowanych systemów, które mogą z niego korzystać. GPU jest oczywiście kompatybilny ze starszymi generacjami PCIe. Kwestię wpływu na wydajność omawiamy w naszym osobnym artykule o skalowaniu PCIe dla RTX 5090. GB202 jest również pierwszym GPU implementującym nowy standard pamięci GDDR7, który podwaja prędkości w porównaniu do GDDR6, jednocześnie obniżając koszt energetyczny przepustowości. NVIDIA nie stosowała półśrodków w przypadku GB202 i wyposażyła go w szeroką 512-bitową magistralę pamięci GDDR7. W RTX 5090 jest ona skonfigurowana z 32 GB pamięci GDDR7 o prędkości 28 Gbps. Nadchodzące modele serii RTX 50 mogą mieć węższe interfejsy pamięci, ale z wyższymi prędkościami pamięci, a niektóre karty graficzne dla profesjonalistów oparte na GB202 mogą nawet wykorzystywać układy pamięci o wysokiej gęstości.
Silnik GigaThread jest główną logiką alokacji zadań renderowania grafiki w GB202, ale pojawił się nowy dodatek – dedykowany procesor szeregowy do zarządzania wszystkimi zasobami przyspieszania AI na GPU, który NVIDIA nazywa AMP (procesor zarządzania AI). Inne komponenty na poziomie globalnym to procesor Optical Flow, element zaangażowany w starsze wersje generowania klatek DLSS i kodowania wideo, oraz rozbudowany silnik przyspieszania mediów składający się z czterech akceleratorów kodowania NVENC i czterech akceleratorów dekodowania NVDEC. Nowe akceleratory kodowania wideo NVENC 9. generacji obsługują kodowanie AV1 i HEVC w formacie 4:2:2. W RTX 5090 aktywowane są 3 z 4 jednostek NVENC i 2 z 4 jednostek NVDEC. W centralnej części GPU znajduje się największy wspólny komponent – pamięć podręczna L2 o pojemności 128 MB. RTX 5090 jest skonfigurowany z 96 MB tej pamięci.

Każdy klaster przetwarzania grafiki (GPC) jest podziałem GPU zawierającym niemal wszystkie komponenty potrzebne do renderowania grafiki. W GB202 klaster GPC składa się z 16 multiprocesorów strumieniowych (SM) rozmieszczonych w 8 klastrach przetwarzania tekstur (TPC) oraz silnika rastrowego zawierającego 16 jednostek ROP. Każdy SM zawiera 128 rdzeni CUDA. W przeciwieństwie do SM generacji Ada, które miały po 64 jednostki FP32+INT32 i 64 czysto FP32 SIMD, nowy SM generacji Blackwell oferuje jednoczesną możliwość przetwarzania FP32+INT32 na wszystkich 128 jednostkach SIMD. Te 128 rdzeni CUDA jest zorganizowanych w cztery sekcje, każda z własnym plikiem rejestrów, pamięcią podręczną instrukcji poziomu 0, planistą warp, dwoma zestawami jednostek load-store oraz jednostką funkcji specjalnych (SFU) obsługującą niektóre specjalne funkcje matematyczne, takie jak trygonometria, wykładniki, logarytmy, odwrotności i pierwiastki kwadratowe. Cztery sekcje współdzielą pamięć podręczną L1 o pojemności 128 KB oraz cztery jednostki TMU. Najbardziej wyjątkowymi komponentami SM Blackwell są cztery rdzenie Tensor 5. generacji oraz rdzeń RT 4. generacji.

Być może największą zmianą w sposobie, w jaki SM obsługuje pracę, wprowadzoną wraz z Blackwell, jest koncepcja shaderów neuronowych – traktowanie części obciążenia renderowania graficznego wykonanego przez model generatywnej AI jako shadery. Microsoft położył podwaliny pod standaryzację shaderów neuronowych poprzez API Cooperative Vectors, w najnowszej aktualizacji DirectX 12. Rdzenie Tensor są teraz dostępne dla obciążeń poprzez shadery neuronowe, a silnik zmiany kolejności wykonywania shaderów (SER) w SM Blackwell jest w stanie dokładniej zmieniać kolejność obciążeń dla rdzeni CUDA i rdzenia Tensor w SM.

Nowy rdzeń Tensor 5. generacji wprowadza obsługę formatu danych FP4 (precyzja 1/8) dla szybko zmieniających się obciążeń atomowych, zapewniając 32-krotnie większą przepustowość w porównaniu z pierwszym rdzeniem Tensor wprowadzonym wraz z architekturą Volta. Na przestrzeni pokoleń modele AI wykorzystywały formaty danych o mniejszej precyzji oraz zjawisko rzadkości (sparsity) w celu poprawy wydajności. Procesor zarządzania AI (AMP) umożliwia jednoczesne wykonywanie obciążeń AI i graficznych na najwyższych poziomach GPU, dzięki czemu może on jednocześnie renderować grafikę w czasie rzeczywistym dla gry i uruchamiać model LLM, bez wzajemnego wpływu na wydajność. AMP jest wyspecjalizowanym planistą sprzętowym dla wszystkich zasobów przyspieszania AI na krzemie. Odgrywa on kluczową rolę w działaniu generowania wielu klatek DLSS 4.

Rdzeń RT 4. generacji nie tylko oferuje generacyjny wzrost wydajności w testowaniu i przecinaniu promieni, co obniża koszt wydajnościowy włączenia path tracingu i efektów ray tracingu, ale wprowadza również potencjalny skok generacyjny w wydajności dzięki wprowadzeniu Mega Geometry. Pozwala to na tworzenie obiektów z ray tracingiem o niezwykle wysokiej liczbie wielokątów, zwiększając ich szczegółowość. Liczba wielokątów i ray tracing powodują liniowy wzrost kosztów wydajnościowych, ponieważ każdy trójkąt musi przecinać się z promieniem, a liczba promieni musi być wystarczająca do przecięcia z każdym z nich. Jest to osiągane poprzez traktowanie klastrów trójkątów w obiekcie jako prymitywów pierwszej klasy oraz struktury przyspieszające na poziomie klastrów. Nowe rdzenie RT wprowadzają komponent nazywany silnikiem przecinania klastrów trójkątów, zaprojektowany specjalnie do obsługi mega geometrii. Integracja formatu kompresji klastrów trójkątów i silnika bezstratnej dekompresji umożliwia bardziej wydajne przetwarzanie złożonej geometrii.

Układ GB202 i reszta rodziny GPU GeForce Blackwell jest zbudowana na dokładnie tym samym procesie technologicznym TSMC 4N co poprzednia generacja Ada, więc NVIDIA skierowała wysiłki na znalezienie innowacyjnych sposobów zarządzania energią i temperaturą. Jest to realizowane poprzez przeprojektowany silnik zarządzania energią, który opiera się na bramkowaniu zegara, bramkowaniu zasilania i bramkowaniu szyn poszczególnych GPC i innych komponentów wysokiego poziomu. Firma pracowała również nad szybkością, z jaką GPU podejmuje decyzje związane z zarządzaniem energią.
Najszybszym sposobem na obniżenie poboru mocy jest dostosowanie częstotliwości taktowania GPU, a wraz z architekturą Blackwell NVIDIA wprowadza możliwość szybkich regulacji zegara na poziomie SM.
NVIDIA zaktualizowała zarówno silnik wyświetlania, jak i silnik mediów w architekturze Blackwell w porównaniu do poprzedniej generacji Ada, która była krytykowana za trzymanie się starszych standardów interfejsów wyświetlania, takich jak DisplayPort 1.4, podczas gdy AMD i Intel przeszły już na DisplayPort 2.1. Dobrą wiadomością jest to, że Blackwell obsługuje DP 2.1 z UHBR20, umożliwiając wyświetlanie obrazu w rozdzielczości 8K przy 60 Hz za pomocą pojedynczego kabla. Firma zaktualizowała również NVDEC i NVENC, które teraz obsługują AV1 UHQ, podwajają wydajność dekodowania H.264, obsługują MV-HEVC i formaty 4:2:2.
Renderowanie Neuronowe

Renderowanie neuronowe zapowiada się być równie transformacyjne dla współczesnej grafiki jak same shadery programowalne. Renderowanie grafiki 3D ewoluowało od stałych funkcji na przełomie wieku, przez shadery programowalne, HLSL, shadery geometryczne, shadery obliczeniowe i ray tracing, na przestrzeni ostatnich kilku dekad. W 2025 roku NVIDIA pisze kolejny rozdział tej podróży wraz z shaderami neuronowymi Blackwell. Umożliwia to szereg efektów opartych na sieciach neuronowych, w tym materiały neuronowe, objętości neuronowe, a nawet neuronowe pola promieniste. Microsoft wprowadził nowe API Cooperative Vectors dla DirectX w niedawnej aktualizacji, umożliwiając dostęp do rdzeni Tensor w ramach API graficznego. W połączeniu z nowym językiem cieniowania, Slang, ten przełom umożliwia programistom bezpośrednie integrowanie technik neuronowych w ich przepływach pracy, potencjalnie zastępując części tradycyjnego potoku graficznego. Slang dzieli duże, złożone funkcje na mniejsze części, które są łatwiejsze do obsługi. Biorąc pod uwagę, że jest to standardowa funkcja API DirectX, nie ma nic, co powstrzymywałoby AMD i Intel przed zintegrowaniem Renderowania Neuronowego (Cooperative Vectors) w ich sterownikach graficznych.
RTX Neural Materials działa w kierunku znaczącego zmniejszenia zajętości pamięci przez materiały w scenach 3D. W przypadku konwencjonalnego renderowania, zajętość pamięci przez materiał jest rozdmuchana przez złożony kod shaderów. Neural materials konwertują kod shaderów i warstwy tekstur na skompresowaną reprezentację neuronową. Prowadzi to do współczynnika kompresji sięgającego 7:1 i umożliwia małym sieciom neuronowym generowanie oszałamiających, filmowych materiałów w czasie rzeczywistym. Na przykład jedwab renderowany za pomocą tradycyjnych shaderów może nie oddawać wielokolorowego połysku widocznego w rzeczywistości. Neural materials natomiast przechwytują skomplikowane detale, takie jak zmiany kolorów i odbicia, ożywiając takie powierzchnie z niezrównanym realizmem – i przy ułamku kosztu pamięciowego.
Neural Radiance Cache (NRC) to nowa funkcja, która dynamicznie trenuje sieć neuronową podczas rozgrywki, wykorzystując GPU użytkownika, umożliwiając przestrzenne buforowanie transportu światła i pozwalając na niemal nieskończoną liczbę odbić światła w scenie. Prowadzi to do realistycznego oświetlenia pośredniego i cieni przy minimalnym wpływie na wydajność. NRC częściowo śledzi 1 lub 2 promienie przed zapisaniem ich w pamięci podręcznej promieniowania i wnioskuje nieskończoną ilość promieni i odbić, aby uzyskać dokładniejsze odwzorowanie oświetlenia pośredniego w scenie gry.
DLSS 4 and Multi Frame Generation

DLSS 4 wprowadza znaczący skok w jakości obrazu i wydajności. Nie jest to tylko aktualizacja wersji wraz z wprowadzeniem nowej funkcji, a mianowicie Multi Frame Generation, ale wprowadza ulepszenia niemal wszystkich podfunkcji DLSS. DLSS od samego początku polegał na sztucznej inteligencji do rekonstrukcji szczegółów w super rozdzielczości, a wraz z DLSS 4 NVIDIA wprowadza nowy model AI oparty na transformatorach, który zastępuje wcześniej używane konwolucyjne sieci neuronowe, oferując dwukrotnie więcej parametrów, czterokrotnie większą wydajność obliczeniową i znacznie poprawioną jakość obrazu. Ray Reconstruction, wprowadzony wraz z DLSS 3.5, otrzymuje znaczącą aktualizację jakości obrazu dzięki nowemu modelowi opartemu na transformatorach.
Aby zrozumieć Multi Frame Generation, trzeba najpierw zrozumieć, jak działa DLSS Frame Generation, wprowadzony wraz z GeForce Ada. Komponent Optical Flow Accelerator dostarcza algorytmowi DLSS dane do wygenerowania całej klatki przy użyciu sieci neuronowej, wykorzystując informacje z poprzedniej wyrenderowanej klatki, efektywnie podwajając liczbę klatek na sekundę. W Multi Frame Generation sztuczna inteligencja przejmuje funkcje optical flow, aby przewidzieć do trzech klatek następujących po konwencjonalnie wyrenderowanej klatce, efektywnie tworząc cztery klatki z wysiłku renderowania jednej.

Zakładając, że ta wyrenderowana klatka jest produktem Super Resolution, gdzie przy maksymalnym ustawieniu wydajności generowane są 4 piksele z pojedynczego wyrenderowanego piksela, otrzymujemy możliwość, w której wysiłek renderowania 1/4 klatki przekłada się na wygenerowanie 4 klatek, czyli 15 z każdych 16 pikseli jest generowanych całkowicie przez DLSS. Przy generowaniu tak wielu klatek, Frame Pacing staje się problemem – nieregularne odstępy między klatkami wpływają na płynność. DLSS 4 rozwiązuje te problemy poprzez wykorzystanie dedykowanej jednostki sprzętowej wewnątrz architektury Blackwell, która zajmuje się pomiarem przełączeń (flip metering), zmniejszając zmienność wyświetlania klatek 5-10 razy. Silnik wyświetlania Blackwell zawiera sprzęt do pomiaru przełączeń.
NVIDIA Reflex 2

NVIDIA Reflex w oryginalnej wersji przyniósł znaczącą poprawę responsywności w maksymalnych ustawieniach graficznych podczas rozgrywek online, poprzez kompresję kolejki renderowania w celu zmniejszenia całkowitego opóźnienia systemu nawet o 50%. Reflex jest obowiązkowy w DLSS 3 Frame Generation ze względu na koszt opóźnień narzucony przez tę technologię. Generowanie wielu klatek wymaga równie zaawansowanej technologii, stąd pojawił się Reflex 2. NVIDIA twierdzi, że osiągnęła 75% redukcję opóźnień dzięki Frame Warp, który aktualizuje pozycje kamery (punktu widzenia) na podstawie danych wejściowych użytkownika w czasie rzeczywistym, a następnie wykorzystuje informacje temporalne do rekonstrukcji klatki do wyświetlenia.
Platforma testowa – RTX 5090
Platforma testowa | |
---|---|
Procesor | Intel Core i9-13900K |
Płyta główna | MSI Pro Z790-A WiFi DDR5 |
Resizable BAR | Włączony, o ile było wsparcie |
Pamięć RAM | Corsair 2x16GB DDR5-6000 MHz 36-38-38-76 |
Chłodzenie | Cooler Master PL360 |
Pasta termo. | Arctic MX-6 |
Dyski twarde | Crucial P5 Plus 2TB |
Zasilacz | Cooler Master MWE 1250 V2 Gold |
System operacyjny | Windows 11 Pro 64-bit |
- Wszystkie karty graficzne są testowane z użyciem tej samej wersji gry.
- Wszystkie gry są ustawione na najwyższe ustawienia jakości.
- Filtr antyaliasingowy (AA) i anizotropowe filtrowanie (AF) są stosowane za pomocą ustawień w grze, a nie za pomocą panelu sterownika.
- Przed rozpoczęciem pomiarów, każdy test jest poprzedzony rozgrzaniem karty graficznej, aby zapewnić stabilny stan testowy. Dzięki temu karta nie będzie przyspieszać do nierzeczywistych wysokich częstotliwości przez kilka sekund, dopóki nie się nie nagrzeje, ponieważ to nie odzwierciedla długotrwałej rozgrywki.
- Dla lepszej przydatności w życiu codziennym, wszystkie testy gier wykorzystują własne sceny testowe w grze, a nie wbudowane benchmarki.
- 1920x1080: Najpopularniejsza rozdzielczość monitora.
- 2560x1440: Pośrednia rozdzielczość między Full HD a 4K, o rozsądnych wymaganiach wydajnościowych.
- 3840x2160: Rozdzielczość 4K Ultra HD, dostępna na najnowszych monitorach wysokiej klasy.
Assassin’s Creed Valhalla



Cyberpunk 2077



DOOM Eternal



Dying Light 2



Elden Ring



F1 22



Far Cry 6



God of War



Red Dead Redemption 2



The Witcher 3 Wild Hunt



Średnia ilość FPS – RTX 5090



DLSS 4




Pobór mocy



Temperatury
Temperatury & Hałas | Spoczynek | Obciążenie (Gaming) | ||||
---|---|---|---|---|---|---|
GPU | Hałas | GPU | Hotspot | Hałas | RPM | |
ASUS RTX 5090 Astral OC | 40°C | Fan Stop | 65°C | 76°C | 39.3 dBA | 1675 RPM |
ASUS RTX 5090 Astral OC (Quiet BIOS) | 40°C | Fan Stop | 70°C | 80°C | 36.5 dBA | 1385 RPM |
MSI RTX 5090 Suprim SOC | 43°C | Fan Stop | 75°C | 80°C | 28.4 dBA | 1093 RPM |
MSI RTX 5090 Suprim SOC (Performance BIOS) | 42°C | Fan Stop | 65°C | 70°C | 36.3 dBA | 1651 RPM |
MSI RTX 5090 Suprim SOC Liquid | 35°C | Fan Stop | 61°C | 74°C | 31.2 dBA | 1179 RPM |
MSI RTX 5090 Suprim SOC Liquid (Performance BIOS) | 35°C | Fan Stop | 59°C | 72°C | 34.2 dBA | 1419 RPM |
Palit RTX 5090 GameRock | 50°C | Fan Stop | 74°C | 82°C | 39.8 dBA | 1894 RPM |
Palit RTX 5090 GameRock (Quiet BIOS) | 51°C | Fan Stop | 75°C | 84°C | 39.1 dBA | 1817 RPM |
NVIDIA RTX 5090 FE | 50°C | Fan Stop | 77°C | 94°C | 40.1 dBA | 1673 RPM |
ASUS RTX 4090 Matrix | 36°C | Fan Stop* | 53°C | 62°C | 37.5 dBA | 1320 RPM |
ASUS RTX 4090 Matrix (Quiet BIOS) | 37°C | Fan Stop* | 58°C | 64°C | 30.0 dBA | 1000 RPM |
ASUS RTX 4090 STRIX OC | 40°C | Fan Stop | 62°C | 70°C | 32.6 dBA | 1330 RPM |
ASUS RTX 4090 STRIX OC (Quiet BIOS) | 42°C | Fan Stop | 65°C | 73°C | 29.8 dBA | 1118 RPM |
Colorful RTX 4090 Vulcan OC | 42°C | Fan Stop | 61°C | 70°C | 36.2 dBA | 1732 RPM |
Colorful RTX 4090 Vulcan OC (Turbo BIOS) | 42°C | Fan Stop | 62°C | 71°C | 36.7 dBA | 1759 RPM |
Gigabyte RTX 4090 Gaming OC | 44°C | Fan Stop | 60°C | 67°C | 37.4 dBA | 1716 RPM |
Gigabyte RTX 4090 Gaming OC (Quiet BIOS) | 41°C | Fan Stop | 64°C | 72°C | 32.6 dBA | 1416 RPM |
MSI RTX 4090 Gaming X | 43°C | Fan Stop | 72°C | 81°C | 30.7 dBA | 1264 RPM |
MSI RTX 4090 Gaming X (Gaming BIOS) | 43°C | Fan Stop | 67°C | 75°C | 34.3 dBA | 1502 RPM |
MSI RTX 4090 Suprim X | 46°C | Fan Stop | 70°C | 77°C | 28.6 dBA | 1198 RPM |
MSI RTX 4090 Suprim X (Gaming BIOS) | 46°C | Fan Stop | 64°C | 70°C | 32.6 dBA | 1466 RPM |
MSI RTX 4090 Suprim Liquid X | 37°C | Fan Stop* | 58°C | 67°C | 32.2 dBA | 1197 RPM |
MSI RTX 4090 Suprim Liquid X (Quiet BIOS) | 38°C | Fan Stop* | 60°C | 69°C | 29.0 dBA | 1105 RPM |
NVIDIA RTX 4090 Founders Edition | 37°C | Fan Stop | 66°C | 74°C | 35.1 dBA | 1449 RPM |
Palit RTX 4090 GameRock OC | 43°C | Fan Stop | 66°C | 73°C | 35.0 dBA | 1539 RPM |
Palit RTX 4090 GameRock OC (Quiet BIOS) | 43°C | Fan Stop | 66°C | 73°C | 31.8 dBA | 1399 RPM |
Zotac RTX 4090 AMP Extreme | 42°C | Fan Stop | 66°C | 75°C | 37.1 dBA | 1434 RPM |
Zotac RTX 4090 AMP Extreme (Quiet BIOS) | 45°C | Fan Stop | 72°C | 81°C | 31.8 dBA | 1152 RPM |
Nvidia RTX 5090 – Podsumowanie
Hierarchia i Architektura
Architektura Blackwell wprowadza kilka ulepszeń pod maską, takich jak nadanie wszystkim shaderom możliwości wykonywania instrukcji FP32 lub INT32 – w architekturze Ada tylko połowa rdzeni miała taką możliwość. Rdzenie Tensor są teraz dostępne ze shaderów poprzez nowe API Microsoft DirectX i obsługują instrukcje FP4 i INT4, które działają z mniejszą precyzją, ale znacznie szybciej i przy mniejszym wykorzystaniu pamięci. Istnieje wiele dodatkowych ulepszeń architektury, o których wszystkich mówiliśmy na pierwszych stronach tej recenzji.
W porównaniu do flagowego modelu poprzedniej generacji, RTX 4090, dzisiejszy RTX 5090 zwiększa liczbę rdzeni GPU do 21 760, w górę z 16 384. Inne liczby jednostek również zostały zwiększone. Jednym z najważniejszych punktów jest przejście na zupełnie nową pamięć GDDR7, która dodatkowo zwiększa przepustowość na pin, a NVIDIA rozszerzyła magistralę pamięci z 384-bitowej do 512-bitowej, co skutkuje oszałamiającą przepustowością pamięci wynoszącą 1,8 TB/s. Z perspektywy procesu produkcji nic się jednak nie zmieniło – Blackwell jest zbudowany w tym samym 5-nanometrowym procesie TSMC „NVIDIA 4N” co Ada poprzedniej generacji. NVIDIA twierdzi, że jest to „proces 4-nanometrowy”, ale podczas cyklu życia architektury Ada potwierdzono, że NVIDIA 4N w rzeczywistości nie jest TSMC N4 (zwróć uwagę na kolejność N i 4), lecz procesem 5-nanometrowym. Ostatecznie sama liczba nie ma wielkiego znaczenia, ważne jest to, że NVIDIA używa tego samego procesu technologicznego.
Wydajność
Nie ma żadnych wątpliwości – RTX 5090 to karta, której potrzebujesz do grania w 4K z maksymalnymi ustawieniami i włączonymi wszystkimi efektami RT. Teoretycznie można by używać tej karty w rozdzielczości 1440p dla osiągnięcia niewiarygodnie wysokiego FPS, ale biorąc pod uwagę, że DLSS 4 zapewni te same wartości FPS nawet w 4K, jedynym powodem, dla którego chciałoby się to zrobić, jest sytuacja, gdy naprawdę zależy nam na najniższych opóźnieniach przy najwyższym FPS.
Ray Tracing i Renderowanie Neuronowe
Pamięć VRAM
DLSS 4 Upscaling & Generowanie Klatek
Chcesz niższego input laga? W takim razie włącz DLSS 4 Upscaling, który obniża rozdzielczość renderowania i skaluje w górę natywną klatkę. W przeszłości toczyło się wiele debat o tym, czy jakość obrazu przy superskalowaniu DLSS jest wystarczająco dobra, niektórzy twierdzili nawet, że jest „lepsza niż natywna” – zdecydowanie się z tym nie zgadzam – jestem jedną z osób uczulonych na superskalowanie DLSS 3, nawet w trybie „jakość.” Wraz z Blackwell, NVIDIA wprowadza model superskalowania „Transformers” dla DLSS, co stanowi znaczącą poprawę w porównaniu z poprzednim modelem „CNN”. Przetestowałem Transformers i jestem zachwycony. Jakość obrazu jest tak dobra, że tryb „Jakość” wygląda jak natywny, czasami nawet lepiej. Nie ma już migotania ani rozmazanych tekstur o niskiej rozdzielczości na horyzoncie. Cienkie przewody są krystalicznie wyraźne, nawet przy rozdzielczości poniżej 4K! Trzeba to zobaczyć na własne oczy, żeby to docenić – to prawie jak magia. Najlepsze w tym wszystkim? DLSS Transformers jest dostępny nie tylko na GeForce 50, ale na wszystkich kartach GeForce RTX z rdzeniami Tensor! Chociaż wiąże się to z około 10% spadkiem wydajności w porównaniu z CNN, nigdy nie wrócę do CNN. Podczas gdy nasz sterownik prasowy był ograniczony do garstki gier z obsługą DLSS 4, NVIDIA będzie miała około 75 gier wspierających tę technologię w dniu premiery, większość poprzez nadpisania w aplikacji NVIDIA, a wiele innych zostało indywidualnie przetestowanych, aby zapewnić najlepsze rezultaty. NVIDIA kładzie szczególny nacisk na zapewnienie, że nie będzie problemów z systemami przeciwdziałającymi oszustwom przy używaniu nadpisań.
Konstrukcja Fizyczna, Temperatury i Hałas
PCI-Express 5.0
Pobór Mocy
RTX 5090 FE jest zaprojektowany z limitem mocy 575 W, który można ręcznie podnieść do 600 W. Jest to duża ilość mocy i ciepła, o 125 W więcej niż w RTX 4090 Founders Edition. Całe to ciepło skończy w twoim pokoju, niezależnie od układu chłodzenia, co oznacza, że małe pomieszczenia do grania będą się nagrzewać podczas dłuższych sesji. Niezwykle nieoczekiwany jest wysoki pobór mocy na biegu jałowym. Zmierzyliśmy około 30 W, co jest jednym z najgorszych wyników, jakie kiedykolwiek widzieliśmy. Intel jest mocno krytykowany za swój pobór mocy na biegu jałowym – NVIDIA Blackwell nie jest wiele lepsza. NVIDIA przedstawiła nam długą prezentację o zarządzaniu energią Max-Q i wszystkich gadżetach efektywnościowych, jakie posiadają, więc podejrzewam, że jest to jakiś rodzaj błędu i NVIDIA to naprawi – podobna sytuacja miała miejsce kilka lat temu (RTX 2080 Ti). Efektywność energetyczna jest podobna do RTX 4090, co jest dość imponujące, ponieważ używają tego samego procesu produkcyjnego, ale mamy tu 32 GB VRAM i większy, mocniejszy GPU.
Ceny i Alternatywy
Alternatywy? Brak. RTX 5090 naprawdę ustanawia nowy standard wydajności, a seria Blackwell wyznacza nowe standardy dla funkcji technologicznych GPU. AMD, najbliższy konkurent, nie ma ani surowej wydajności, ani niczego, co mogłoby konkurować z funkcjami programowymi takimi jak DLSS multi-frame-generation czy nowy model skalowania Transformers. Dominacja NVIDIA wśród studiów gier zapewni, że obsługa DLSS 4 pojawi się praktycznie we wszystkich nowych wydaniach – bez wątpienia. Z drugiej strony, cena 2000 dolarów jest wyjątkowo wysoka, o 400 dolarów więcej niż RTX 4090, ale myślę, że NVIDIA i tak sprzeda wszystkie karty, które ma. RTX 5090 jest najlepszy, ale trzeba być przygotowanym na wydanie nieadekwatnej kwoty. Według niektórych pogłosek, dostępność RTX 5090 będzie problematyczna, z tylko małą ilością w magazynach sprzedawców, które trafią do sprzedaży 30 stycznia. Karty poprzedniej generacji RTX 40 wcale nie są jednak przestarzałe. Dzięki DLSS Transformers otrzymujesz darmową aktualizację jakości obrazu na wszystkich kartach RTX. Poza tym, czy rozgrywka nie jest najważniejsza? Bardziej niż grafika? Czy gry są przyjemne w 1080p, ze średnimi ustawieniami? Absolutnie tak, o ile gra jest dobra.
RTX 5090 – Najczęściej zadawane pytania (FAQ)
Premiera i pierwsze testy pojawią się 23 i 24 stycznia.