Souboj grafických titánů
Nový grafický čip Kepler od nVidie vyzval na souboj konkurenční GPU s kódovým označením Tahiti od AMD. Který z nich má větší herní výkon?
MICHAEL ECKSTEIN
MICHAEL ECKSTEIN
Nová generace grafických karet ohromila redaktora Chipu kombinací špičkového grafického výkonu a relativně nízké spotřeby elektrické energie.
Na grafickém výkonu záleží, zvláště pak pokud je řeč o desktopech. Díky výkonné grafice si můžeme zahrát na stolním počítači ty nejmodernější hry ve vysokém rozlišení a s maximálními detaily. Grafika integrovaná do nejnovějších procesorů Intel sice bohatě stačí na přehrávání videa a práci s multimediálními soubory, ale náročnější hry si na ní prostě neužijeme tak, jak bychom chtěli. Moderní špičkové grafiky mají 10x až 20x vyšší herní výkon (záleží na použitém benchmarku) než integrovaná grafika Intel HD 4000. Segment dedikovaných grafických karet ovládají tradičně firmy AMD a nVidia, které se každý půlrok přetahují o pomyslné žezlo nejvýkonnější dostupné grafiky. Tyto firmy se ale při vývoji ubírají rozdílnými technickými cestami. Na počátku tohoto roku se prvenství zmocnila AMD, a to díky GPU s architekturou GCN (GraphicsCoreNext neboli „R1000/ Tahiti“). Nyní hlásí nVidia, že díky svému nejnovějšímu grafickému procesoru GK104, založenému na architektuře Kepler, prvenství AMD opět vyrve.
Prozkoumali jsme rozdíly obou architektur a podrobili jsme náročnému testu desktopové i mobilní verze obou grafických čipů. Už jen výčet technických specifikací obou GPU zní impozantně. Procesor GK104 obsahuje na ploše 294 mm2 celkem 3,54 miliardy tranzistorů. Grafický čip Tahiti od AMD je ještě větší a složitější: celkem se skládá z 4,31 miliardy tranzistorů rozprostřených na ploše 365 mm2. Důvod, proč obsahuje grafický čip od AMD takové množství tranzistorů, spočívá v tom, že kromě zpracování her slouží i jako víceúčelový GPGPU čip. GPGPU je zkratka z anglického „General Purpose Computation on Graphics Processing Unit“ a označuje grafické procesory schopné vykonávat všeobecné výpočetní operace. Takový GPGPU pak dokáže pomáhat CPU počítače a díky odlišné architektuře zvládne zpracovat například vědecké a technické simulace mnohem rychleji než CPU. Pro podobné účely vyvinula nVidia GPU s označením Tesla, ale GK104 je čistě herní procesor s jedinou ambicí, a to aby dosahoval co nejvyššího herního výkonu. Základní strukturu tohoto procesoru tvoří čtyři jednotky Graphics Processing Cluster (GPC), z nichž každá se skládá ze dvou přepracovaných streamingových multiprocesorů (SMX). Každý SMX se pak skládá ze 192 Cuda jader, tedy shaderovacích jednotek.
V každém SMX se dále nachází čtyři Warp plánovače, osm Dispatch jednotek a 16 texturovacích jednotek. Celkem má tedy nové GPU k dispozici 1 536 shaderů. Jejich frekvence je stejná jako frekvence ostatních komponent grafického čipu a je v porovnání s předchozí generací GPU dvakrát vyšší. Zdá se, že nVidia dosáhla vrcholu možností současného Hotclocks-Shader modelu.
Konkurenční čip AMD Tahiti obsahuje celkem 2 048 shaderů. U architektury GCN se firma AMD rozhodla obejít bez tzv. VLIW (Very Long Instruction Word) způsobu zpracování instrukcí v shaderu a stejně jako nVidia nyní používá tzv. 1D-shadery, které trvale využívají 100% výkonu, zatímco účinnost VLIW shaderů se pohybovala okolo 70 až 80 procent. Důvod spočívá v tom, že shadery částečně zpracovávají stejné instrukce sledu příkazů a procesor musí před zpracováním některých závislých instrukcí počkat na dokončení jiných výpočtů. AMD nově sestavilo shadery do výpočetních jednotek Compute Units (CU), z nichž každá (viz graf vpravo) obsahuje čtyři vektorové jednotky (VU), které dále obsahují 16 aritmeticko-logických výpočetních jednotek (ALU). Každé VU lze přidělovat úkoly samostatně. Tímto způsobem lze efektivně řešit i závislosti ve sledu příkazů čekajících na zpracování. Každá jednotka CU rovněž obsahuje čtyři texturovací jednotky a skalární koprocesor (skalární jednotku), který je určen pro zpracování speciálních úkolů. nVidia má pro tento účel v GPU dedikované jednotky Special Function Units (SFU).
Výměna dat mezi procesorem Tahiti a pamětí GDDR5 probíhá prostřednictvím datové sběrnice o šířce 384 bitů. nVidia používá datovou sběrnici o šířce 256 bitů. Kepler komunikuje stejně jako Tahiti s hlavním procesorem počítače prostřednictvím sběrnice PCI Express 3.0. Oba výrobci nabízí podporu většího množství videovýstupů, včetně HDMI 1.4a, které zvládne přenášet dostatek dat i do monitorů s rozlišením 4K. nVidia podporuje Surround Gaming, takže ke kartě GTX680 lze najednou připojit až čtyři monitory. AMD možnost připojení většího množství monitorů nabízí již delší dobu. Oba GPU jsou vybaveny vestavěnými možnostmi přetaktování a zvýšení herního a výpočetního výkonu. Maximální hranice přetaktování je omezena pouze navrženým tepelným výkonem (Thermal Design Power, TDP), který u nVidie činí 195 W a u AMD 230 W.
Výhody nVidie: Menší, přesto rychlejší
Výsledky našich testů ukázaly, že se nVidii podařilo nemožné. I když má GeForce GTX680 méně shaderů než Radeon HD7970, nabízí vysoký výkon a zároveň má nižší spotřebu. V nových DirectX 11 hrách je dokonce rychlejší než AMD. Nejvyšší model grafické karty GeForce GTX690 dokonce obsahuje dva GPU GK104 a v testech 3D Mark vykázala tato karta bezkonkurenčně nejvyšší herní výkon. Plný výkon obou procesorů ale dokázala využít pouze hra S. T. A. L. K. E. R., ostatní hry zatím plného potenciálu karty GTX690 nedokázaly využít.
V případě mobilních verzí obou grafických čipů je situace méně jasná. Zatímco mobilní verze GTX680M se v benchmarcích 3D Mark přibližuje výkonu desktopových grafik GTX680 a Radeon HD7970, při reálném hraní her za nimi zaostává, a to hlavně ve vysokých rozlišeních. V tomto ohledu je na tom HD7970 o poznání lépe, ale naopak za GTX680M ztrácí v nízkém rozlišení. Podle našeho očekávání obě mobilní grafiky převyšují výkon integrované grafiky Intel HD4000. Výkon HD4000 integrované do procesoru Intel Core i7 výrazně zaostával za oběma dedikovanými herními monstry. Opravdový výkon grafických karet při reálném hraní závisí nejen na architektuře použitého GPU, ale i na optimalizaci ovladačů. V této oblasti (a hlavně v segmentu ovladačů pro mobilní grafické čipy) má dlouhodobě nVidia navrch nad AMD.
SHRNUTÍ TESTU
Pokud si chcete užít hraní moderních, hardwarově náročných her ve vysokém rozlišení a se všemi dostupnými detaily, budete potřebovat hodně výkonnou grafickou kartu. Ani jedna z testovaných desktopových grafik vás určitě nezklame. V kombinaci s výkonným CPU pak nabízí dostatek výkonu pro hraní nejnáročnějších her v rozumném rozlišení i obě mobilní verze dedikovaných grafik od AMD a nVidie.
Vítěz testu Nejvyšší herní výkon přináší dvouprocesorová grafická karta nVidia GeForce GTX690, tento výkon je však vyvážen i extrémně vysokou cenou. Ani dnes navíc nenajdete hry, které by plně využily její výkonnostní potenciál. Za rozumnější cenu lze ale pořídit kartu GeForce GTX680, která skončila s minimálním odstupem na druhém místě.
Cenový tip Grafika AMD Radeon HD7970 je sice o trochu pomalejší než konkurenční model nVidia GeForce GTX680, ale stále nabízí více než dostatek potřebného herního výkonu pro jakoukoliv současnou hru, a to i ve vysokém rozlišení. Oproti GeForce GTX680 je ale výrazně levnější.
Mobilní grafické karty Nejnovější generace dedikovaných mobilních GPU přináší až desetkrát vyšší výpočetní výkon, než jakým vládne integrovaná grafika Intel HD4000. Při hraní her na notebooku je rozdíl doslova obrovský. Výkonově jsou dokonce srovnatelné se střední kategorií desktopových karet. V přímém souboji poráží čipy nVidia GeForce GTX680M o něco pomalejší GPU AMD Radeon HD7970M.
POROVNÁNÍ ARCHITEKTUR
Grafické procesory jsou konstruovány tak, aby dokázaly provádět velké množství paralelních výpočtů. Současné zpracování mnoha úloh se hodí například pro výpočty barevného podání pixelů.
NVIDIA
V jednom streamovacím multiprocesoru (SMX) se nachází 192 Cuda jader. Dva SMX pak vytvářejí Graphic Processing Cluster (GPC) a jedno GPU Kepler GK104 obsahuje čtyři GPC klastry. Čip GK104 tedy disponuje celkem 1 536 shaderovacími jednotkami, které používá velmi efektivně.
AMD
Jedna výpočetní jednotka (Compute Unit) se v GPU AMD Tahiti skládá ze čtyř vektorových jednotek, z nichž každá obsahuje 16 shaderů. Celkem pak celý grafický procesor obsahuje 32 CU jednotek, a má tedy dohromady 2 048 shaderů. Každá vektorová jednotka pracuje nezávisle a dosahuje tak vysoké účinnosti při zpracování paralelně prováděných příkazů
ROZŠÍŘENÝ OBZOR
Obě grafická řešení podporují výstup na větší množství monitorů. AMD svoji technologii nazývá Eyefinity, zatímco nVidia ji označuje jako Surround-Gaming. V obou případech výstup na více monitorů funguje spolehlivě a přináší obzvlášť intenzivní herní atmosféru.
Foto popis| Dvouprocesorová nVidia GTX 690 je momentálně nejvýkonnější dostupnou grafikou.
Foto popis| Nejlepší poměr mezi výkonem a cenou nyní přináší GHz edice grafik AMD Radeon HD7970.
Foto popis| V reálných situacích disponují karty GTX 680 skoro stejně vysokým výkonem jako vítězné verze GTX 690.