NVIDIA ForceWare 337.50 - czy to coś daje?2014-05-01 11:26:00 | Piotr Urbaniak (gtxxor) Tomasz Cugowski (tomcug)
Rok 2014 na dobrą sprawę dopiero się zaczął, a już byliśmy świadkami wydarzenia, które być może zapoczątkuje prawdziwą rewolucję w świecie gier 3D. Chodzi oczywiście o technologię AMD o nazwie Mantle, która ma być lekarstwem na odwieczny problem narzutu (na procesor) sterowników oraz API. Jak pokazały dotychczas wydane gry wspierające to rozwiązanie, czyli Battlefield 4 oraz Thief, rezultaty potrafią być naprawdę znakomite. Na odpowiedź konkurenta z Santa Clara nie musieliśmy długo czekać. Nie jest to jednak żadna nowość, a ewolucja dobrze znanego rozwiązania w postaci sterowników ForceWare. Być może niektórzy są rozczarowani takim obrotem spraw, ale NVIDIA obiecuje wzrosty wydajności równie spektakularne, co w przypadku rozwiązania "czerwonych". Jak jest naprawdę? Już wkrótce się o tym przekonacie.
Mantle vs. ForceWare 337.50 - teoria
Słowem wstępu
Jeśliby pieczołowicie przewertować listy zmian w nowych wersjach sterowników (obu wiodących producentów akceleratorów graficznych), to w oczy rzuci się jeden wspólny mianownik. Zarówno AMD, jak i NVIDIA regularnie obiecują spektakularny wzrost wydajności w grach. Niestety, odważne deklaracje są przeważnie hasłami marketingowymi, a kolejne "drajwery" wnoszą najwyżej szczątkową poprawę.
AMD Mantle - "dziecko" monopolu konsolowego
Jakiś czas temu, firma AMD ogłosiła, że przygotowują dla swoich klientów prawdziwą rewolucję. "Czerwoni", korzystając z monopolu na rynku konsolowym, postanowili zaimplementować w grach komputerowych API niskiego poziomu. To rozwiązanie miało nie tylko ułatwić przenoszenie produkcji pomiędzy platformami, ale również (a może przede wszystkim) korzystnie wpłynąć na wydajność akceleratorów z rodziny Radeon.
Wbrew pozorom, pomysł inżynierów AMD był dość trywialny. Idea zakładała stworzenie środowiska programistycznego, które wykorzysta instrukcje bliskie kodowi maszynowemu. Dzięki temu, procesor centralny (CPU) komputera nie będzie nadmiernie obciążony "tłumaczeniem" poleceń. Analogicznie rozwiązanie wykorzystuje się przy programowaniu na konsole, a także inne urządzenia o zamkniętej strukturze sprzętowej (np. tablety iPad).
Projekt "czerwonych" został wcielony w życie pod nazwą handlową Mantle. Trzeba przyznać, że nowe API zostało przyjęte dość entuzjastycznie, co niejako świadczy o zaletach ww. rozwiązania. Niemniej, instrukcje "low-level" trapione są dwoma bardzo poważnymi problemami.
Po pierwsze, takowe polecenia można zastosować tylko wobec wąskiej grupy urządzeń (w tym przypadku były to karty AMD Radeon, bazowane na architekturze Graphics Core Next (GCN)). Oczywiście, możliwe jest utworzenie pakietów kompatybilnych z innymi rozwiązaniami sprzętowymi (np. starsze akceleratory VLIW4 oraz VLIW5), jednak wymaga to sporych nakładów pracy i podmiotowego traktowania każdej platformy.
Po drugie, kompatybilność z Mantle jest "uzyskiwana" jeszcze na etapie produkcji gry (aplikacji). Oznacza to, że program musi zostać utworzony w oparciu o technologię AMD. Jako iż, wyłącznościowe wsparcie tego API znacznie ogranicza kompatybilność sprzętową aplikacji, to deweloperzy nie mogli postawić na taką opcję. Zawężyłoby to grono potencjalnych odbiorców, a co za tym idzie zmniejszyło zyski ze sprzedaży. Zamiast tego, twórcy priorytetowo korzystali z "uniwersalnych" bibliotek DirectX / OpenGL, a Mantle stało się swoistym "smaczkiem" dla posiadaczy odpowiednich GPU.
Testy wykazały, że zaprezentowana technologia faktycznie pozwala(ła) uzyskiwać przewagę nad konkurencją. API Mantle, zgodnie z oczekiwaniami zmniejszało wykorzystanie procesora w grach. Skutkowało to wzrostem liczby wyświetlanych klatek. Zwłaszcza na konfiguracjach ze słabszymi procesorami centralnymi. Więc w czym tkwi "haczyk"? Ano, w tym, że wśród wysokobudżetowych gier "supportujących" opisywanie środowisko, znalazły się jedynie dwie produkcje - Thief oraz Battlefield 4... Mało.
Mantle vs. ForceWare 337.50 - teoria cd.
NVIDIA ForceWare 337.50 - "zielona" kontrofensywa
Programiści zatrudnieni w NVIDII, wbrew pozorom mieli dość twardy orzech do zgryzienia. "Zieloni" od kilku lat praktykowali wielowątkową optymalizację oprogramowania. Ich metodyka sprawdzała się doskonale w przypadku najwydajniejszych (i zbalansowanych) zestawów komputerowych. Aczkolwiek potrafiła zawodzić w obliczu wykorzystania dwuwątkowych układów centralnych (procesorów). Czyli dokładnie w takich sytuacjach, w których AMD Mantle miało najwięcej do "powiedzenia".
Koncern z Santa Clara nie mógł sobie pozwolić na "przekalkowanie" konkurencyjnego rozwiązania, bowiem nie dysponował zapleczem w postaci deweloperów konsolowych. O ile w przypadku GCN, niemalże wystarczyło przekompilować kod uprzednio utworzony na potrzeby PS4 / Xbox One (znaczne uproszczenie), o tyle dla Keplera (aktualnej architektury procesorów graficznych NVIDIA) należałoby tworzyć aplikację zupełnie od podstaw.
Inżynierowie NVIDII, zamiast zbędnie zwiększać złożoność dewelopingu, postawili na ulepszenie obecnie wykorzystywanych rozwiązań. Technicy skoncentrowali się na optymalizacji algorytmów, które odpowiadają za translację poleceń API DirectX.
Wzrost wydajności z tytułu tego działania, raczej nie będzie tak spektakularny jak w przypadku AMD. Natomiast, odświeżony sterownik ForceWare obejmuje szersze spektrum gier i aplikacji. Rozwiązanie NVIDII powinno (przynajmniej w teorii) przynieść korzyści w każdej produkcji, która oparta jest o DirectX 10 lub 11. Dodatkowo nie ogranicza się ono do najnowszej serii akceleratorów i wspiera wszystkie karty, które obsługują napomknięte wersje DX (również Fermi - 4xx / 5xx ).
Zastanawiacie się, czy tym razem rzeczywistość odbiegnie od reguły i ilość "przegoni" jakość? A może ogólnikowe podejście wcale nie okaże się gorsze? Czy inżynierowie stanęli na wysokości zadania? Zapraszamy do części testowej!
Platforma i metodologia testowa
Platforma testowa
Metodologia
Wszystkie pomiary były powtarzane trzykrotnie, a na wykresach znajduje się średnia arytmetyczna uzyskanych wartości. Niepewność pomiarowa nie przekracza 1%. Dodatkowo wymusiliśmy rozdzielczość zegara czasu rzeczywistego 0,5 ms, co ma pewne znaczenie chociażby w przypadku Crysis 3.
Miejsca testowe zostały tak dobrane, aby w maksymalnym stopniu obciążały procesor i były jak najmniej zależne od wydajności karty graficznej. Naszym celem jest sprawdzenie, jak poszczególne układy będą współpracowały w połączeniu ze sterownikami obu firm. Dlatego też, pod żadnym pozorem nie należy traktować wyników jako porównania układów graficznych!
Wydajność - FX-8350
Alan Wake's American Nightmare
W Alan Wake's American Nightmare obserwujemy mierzalną przewagę nowego sterownika, jednak na dobrą sprawę jest ona symboliczna. Konkurent radzi sobie dużo gorzej, przez co komfort rozgrywki na Radeonie jest znacznie niższy.
Battlefield 4
Podobnie sytuacja wygląda w Battlefield 4, z tym, że tutaj przewaga ForceWare 337.50 nad poprzednikiem jest delikatnie wyższa w porównaniu do poprzedniej gry. Mantle daleko z przodu, w zasadzie poza wszelką konkurencją.
Call of Duty: Black Ops
Call of Duty: Ghosts to już pokaz nieprzeciętnych możliwości najnowszego dzieła programistów z "zielonego" obozu. Przewaga nad ForceWare 335.23 wynosi ponad 46%, co jest wynikiem spektakularnym. Można powiedzieć, że o ile na karcie AMD rozgrywka była wątpliwą przyjemnością, o tyle przesiadka na GTX 580 umożliwia w miarę normalną grę. Zaś w połączeniu z nowym sterownikiem, wreszcie uzyskujemy niezaprzeczalną płynność rozgrywki.
Crysis 3
Pierwsza z lokacji testowych, bez względu na resztę oprogramowania wykorzystuje wszystkie dostępne rdzenie. Stąd brak znaczących różnic pomiędzy poszczególnymi sterownikami.
Źródło wszelkiego zła to już zupełnie odrębna historia, która zakończyła się kolejnym zwycięstwem NVIDII. ForceWare 337.50 zapewniają prawie 15% przyrostu wydajności, co ma duże znaczenie dla komfortu rozgrywki. Sterowniki Catalyst wyjątkowo słabo współpracują w tym tytule z FX-8350.
Crysis Warhead
Poprzednia odsłona popularnego cyklu to już symboliczna przewaga testowanego rozwiązania nad poprzednikiem. Konkurent z obozu "czerwonych" wciąż znacząco "z tyłu".
Lost Planet 2
Sytuacja podobna do tej, którą obserwowaliśmy na mapie "trawkowej" w Crysis 3. Wydajność stoi na porównywalnym poziomie, bez względu na zastosowany sterownik.
Metro: Last Light
Ciężko wyciągnąć jakieś wnioski w przypadku Metro: Last Light, gdyż gra ma bardzo małe wymagania odnośnie procesora. W obu przypadkach dotarliśmy do kresu możliwości wykorzystanych układów graficznych.
S.T.A.L.K.E.R.: Zew Prypeci
Ponownie obserwujemy lekką przewagę najnowszych sterowników NVIDII, zupełnie jak w przypadku Crysis Warhead.
Splinter Cell: Blacklist
Splinter Cell: Blacklist to kolejny znaczący wzrost wydajności, uzyskany w wyniku zastosowania ForceWare 337.50. Różnica w stosunku do poprzednika wynosi prawie 13%. Radeon traci do konkurenta całkiem sporo, jednak w tym przypadku nie robi to znaczącej różnicy, gdyż rozgrywka jest płynna na obu konfiguracjach.
Wiedźmin 2: Zabójcy Królów
Podobne relacje obserwujemy w Wiedźminie 2, ale tutaj przewaga osiągnięta przez "zielonych" przekłada się na wyraźnie lepszy komfort rozgrywki.
Wydajność - Core 2 Duo E 7300 @ 4 GHz
Alan Wake's American Nightmare
Alan Wake's American Nightmare to dość dziwny przypadek, bowiem w połączeniu z Core 2 Duo E7300 jest po prostu... dużo wolniej, niż było. ForceWare 335.23 zapewnia znacznie wyższą wydajność, uzyskując wynik marginalnie lepszy od konkurenta z obozu AMD.
Battlefield 4
W Battlefield 4 jak na dłoni widać problemy sterowników NVIDII, we współpracy z dwurdzeniowymi procesorami. Najnowsza wersja przynosi co prawda lekką poprawę, lecz wciąż jest to "kropla w morzu potrzeb". Warto również dodać, że użytkownicy takich konfiguracji są dodatkowo narażeni w tej grze na dziwne przycięcia, bądź przeskoki animacji. To z kolei sprawia, że nawet przy porównywalnych wskazaniach FRAPS-a, dużo lepiej gra się na Radeonie. Mantle także i tym razem króluje niepodzielnie, nie pozostawiając złudzeń rywalom.
Call of Duty: Black Ops
W Call of Duty: Ghosts sytuacja wygląda już zupełnie inaczej. Nowy sterownik NVIDII zapewnia dużą, 37-procentową poprawę wydajności i jeszcze bardziej oddala się od konkurenta. Firma AMD ma ogromny problem z tą produkcją. Podobnie jak swego czasu z Assassin's Creed III.
Crysis 3
Witamy w dżungli zdaje się być mapą mało wrażliwą na wpływ zastosowanego sterownika, jednak przy wydajności nieprzekraczającej 10 FPS raczej nie ma to najmniejszego znaczenia.
Druga lokacja testowa wykazuje już spory zysk wynikający z zastosowania ForceWare 337.50, które zapewniają poprawę "osiągów" o ponad 20%. Niestety, także w tym przypadku posiadacze kart GeForce nękani są przez dziwne przycięcia, które sprawiają, że realne odczucia nijak mają się do wskazań oprogramowania testującego wydajność.
Crysis Warhead
Crysis Warhead wykazuje niewielką przewagę testowanego rozwiązania nad poprzednikiem. Mimo wszystko fakt, że optymalizacje nie omijają nawet dość wiekowych gier, powinien cieszyć użytkowników.
Lost Planet 2
Podobnie jak w przypadku testów z wykorzystaniem AMD FX-8350, także i tym razem nie zaobserwowaliśmy żadnych różnic wydajnościowych.
Metro: Last Light
Metro: Last Light to kolejna produkcja, gdzie oprogramowanie NVIDII sprawia znaczące problemy w połączeniu z testowanym procesorem. Wydajność jest sporo niższa od tej, na którą mogą liczyć posiadacze Radeonów. Co prawda ForceWare 337.50 jest o 8% szybszy od poprzednika, ale raczej jest to marne pocieszenie.
S.T.A.L.K.E.R.: Zew Prypeci
Tak samo jak w przypadku Crysis Warhead, odnotowaliśmy umiarkowany zysk wydajnościowy wynikający z "przesiadki" na najnowsze sterowniki.
Splinter Cell: Blacklist
W Splinter Cell: Blacklist ponownie widzimy przyzwoity zysk wydajnościowy, który niestety niewiele ma wspólnego z tym, co obserwujemy na ekranie. Pomimo znacznie niższej liczby FPS na karcie AMD, realna płynność jest prostu zdecydowanie lepsza, gdyż gracz nie jest "częstowany" ciągłymi zacięciami animacji.
Wiedźmin 2: Zabójcy Królów
Wiedźmin 2 z kolei nie wykazuje różnic pomiędzy sterownikami obu producentów. W każdym przypadku osiągi są na porównywalnym, dość przyzwoitym poziomie.
Wydajność - Core 2 Extreme QX9770 @ 4 GHz
Alan Wake's American Nightmare
W Alan Wake's American Nightmare obserwujemy podobne różnice do tych uzyskanych na FX-8350, czyli niewielką przewagę ForceWare 337.50 nad poprzednikiem oraz znacznie niższą wydajność rozwiązania AMD.
Battlefield 4
Battlefield 4 to już śladowy zysk wydajnościowy wynikający z zastosowania najnowszych sterowników NVIDII. Tym razem jednak konkurent okazał się niewiele gorszy, ale wciąż jest to zauważalnie niższy poziom. Mantle dominuje, zapewniając zdecydowanie najwyższe osiągi.
Call of Duty: Black Ops
Kolejna gra to w zasadzie obrazek, do którego poprzednie testy powinny już nas przyzwyczaić. Nowość ze stajni "zielonych" zapewnia znakomitą wydajność, tym razem różnica względem ForceWare 335.23 wynosi ponad 32%. AMD daleko z tyłu, przez co komfort rozgrywki na Radeonie jest bardzo słaby.
Crysis 3
Pierwsza mapa nie wykazuje znaczących różnic, ale warto zwrócić uwagę na pewną anomalię. Osiągi Core 2 Extreme QX9770 są tutaj ponad dwukrotnie wyższe od identycznie taktowanego Core 2 Duo E7300 (4 GHz). Pozwala to przypuszczać, że obie firmy mają jakiś problem z nadmiernym obciążeniem, bądź też przyczyną jest sama gra.
Źródło wszelkiego zła to kolejny przykład świetnej pracy wykonanej przez programistów giganta z Santa Clara. Przewaga nowości nad ForceWare 335.23 wynosi ponad 33%, co przekłada się na ogromną różnicę w komforcie rozgrywki. Sterowniki AMD na szczęście nie radzą już sobie tak słabo, jak w połączeniu z FX-8350.
Crysis Warhead
W przypadku Crysis Warhead raczej nie liczyliśmy na cuda, ale najnowsze oprogramowanie NVIDII także i tym razem pozwoliło na wykrzesanie dodatkowej mocy z wykorzystanego procesora.
Lost Planet 2
Lost Planet 2 zdaje się być grą niewrażliwą na wpływ sterownika graficznego. Trudno więc dopatrzyć się jakiejś różnicy między konkurencyjnymi rozwiązaniami.
Metro: Last Light
Wnioski, jakie można wyciągnąć z powyższego wykresu, zdecydowanie stoją w sprzeczności z wynikami uzyskanymi na procesorze dwurdzeniowym. W połączeniu z Core 2 Extreme QX9770 zarówno Catalyst, jak i ForceWare zapewniają bardzo porównywalny poziom wydajnościowy w Metro: Last Light.
S.T.A.L.K.E.R.: Zew Prypeci
Sytuacja niemalże identyczna do tej zaobserwowanej w Crysis Warhead, co już chyba nikogo nie powinno dziwić.
Splinter Cell: Blacklist
W Splinter Cell: Blacklist zdecydowanie lepiej radzi sobie GTX 580. ForceWare 337.50 osiąga sporo wyższą wydajność od poprzednika, dodatkowo zwiększając przewagę nad AMD. Co prawda w przypadku FX-8350 nie miało to większego znaczenia, jednak w tym przypadku dodatkowy FPS jest już dużo bardziej cennym "towarem".
Wiedźmin 2: Zabójcy Królów
Nie inaczej jest w Wiedźminie 2, gdzie nie obserwujemy jednak żadnego zysku wydajnościowego po przesiadce na najnowsze sterowniki "zielonych".
Podsumowanie
Nie ulega wątpliwości, że ForceWare 337.50 nie jest rozwiązaniem pod jakimkolwiek względem rewolucyjnym. To po prostu udana ewolucja istniejącego oprogramowania, czyli coś, co programiści NVIDII z dużymi sukcesami robią od dwóch lat. W większości gier różnica "osiągów" nie jest porażająca, jednak w kilku produkcjach zysk wydajnościowy jest bardziej niż znaczący. Dalsza część podsumowania została podzielona na trzy części, poświęcone poszczególnym procesorom.
AMD FX-8350
Nietrudno zauważyć, że GeForce wręcz zdemolował swojego rywala w połączeniu z flagowym procesorem konkurencyjnej firmy. Taka sytuacja po prostu nie powinna mieć miejsca, nawet ze względów wizerunkowych. Jednak ciężko się temu dziwić, skoro na przestrzeni dwóch lat, czyli od momentu, kiedy to jeszcze AMD miało lepsze sterowniki, poza poprawkami dla pojedynczych gier „czerwoni” nie zrobili prawie żadnego postępu. Pozostaje mieć nadzieję, że firma z Sunnyvalle wreszcie weźmie się w garść, gdyż Mantle obecny jest w zaledwie dwóch grach i nie zanosi się na to, żeby w najbliższej przyszłości stał się obowiązkowym dodatkiem do każdej wychodzącej produkcji. Wracając do ForceWare 337.50, uważamy, że jedynym uzasadnionym przeciwwskazaniem odnośnie ich użycia mogą być problemy z niektórymi grami. W przeciwnym wypadku zmiana na najnowszą wersję przyniesie w połączeniu z procesorami AMD FX znaczne korzyści i jest wysoce wskazana.
Intel Core 2 Duo E7300
Zupełnie inaczej sytuacja wygląda w połączeniu z Core 2 Duo E7300. Od czasu pierwszych doniesień o problemach sterowników ForceWare z procesorami dwurdzeniowymi minęły już cztery lata, a na dobrą sprawę niewiele się zmieniło. Być może patrząc wyłącznie na wskazania FRAPS-a dojdziemy do wniosku, że jest dużo lepiej, ale naszych oczu już nie oszukamy. Posiadaczy takich konfiguracji wciąż nękają dziwne zjawiska, takie jak nieregularne przycięcia, przeskoki animacji, czy też charakterystyczne "żabkowanie". Oczywiście nie dotyczy to każdej produkcji, ale o skali zjawiska niech świadczy chociażby fakt, że wśród dziesięciu testowanych gier problem pojawił się w Battlefield 4, Crysis 3, Metro: Last Light oraz Splinter Cell: Blacklist, a więc niemalże połowie z nich. Być może w przypadku nowszych układów dwuwątkowych jest już lepiej, ale na chwilą obecną nie mieliśmy możliwości zweryfikowania tego założenia. Mimo wszystko uważamy, że w tym przypadku Radeony wciąż są sporo lepszą propozycją. Co prawda w części gier wydajność będzie niższa, ale za to realna płynność jest prawie zawsze adekwatna do ilości FPS.
Intel Core 2 Quad QX9770
Z kolei zastosowanie sterowników ForceWare 337.50 z procesorem Core 2 Quad QX9770 dało rezultaty bardzo podobne do tych osiągniętych na topowym układzie AMD. Wydajność jest zdecydowanie wyższa w lwiej części przypadków i, co istotne, są to często dość znaczące różnice, które przekładają się na wyższy komfort rozgrywki. Fakt, że nawet użytkownicy starszego sprzętu mogą liczyć na znaczącą poprawę osiągów powinien wielu dać do myślenia, gdyż jest to coś, czego na ogół nie uświadczymy na Radeonach. Naprawdę ciężko znaleźć jakieś argumenty na obronę "czerwonych". Jak już wspomnieliśmy, Mantle obecne jest w śladowej grupie tytułów, a wyższa wydajność potrzebna jest praktycznie wszędzie, szczególnie dla posiadaczy słabszych procesorów. Najbardziej "palącym" problemem są obecnie katastrofalne osiągi w Call of Duty: Ghosts. Trudno, bowiem inaczej nazwać sytuację, w której konkurent zapewnia wydajność wyższą niemalże dwukrotnie. Mamy nadzieję, że programiści firmy z Sunnyvale uporają się z tym problemem i już wkrótce będzie można normalnie pograć nawet na słabszym sprzęcie.