NVIDIA G200 - wh.cs.vsb.czwh.cs.vsb.cz/mil051/images/2/28/PAP_Představení_grafického_procesoru...UDA je unifikovaná architektura druhé generace umožňující využít u grafických

PŘEDSTAVENÍ GRAFICKÉHO PROCESORU

NVIDIA G200

Bc.Adam Berger Ber 208

Historie a předchůdci G200

V červnu roku 2008 spatřila světlo světa nová grafická karta od společnosti

Nvidia. Tato grafická karta opět posunula veškeré chápání grafiky o kus dál a

přináší tak mnohem věrohodnější, rychlejší a lepší zpracování obrazu. Její vývoj

trval bezmála 4 roky. Výsledek snažení skutečně stojí za to.

Předchůdcem grafického čipu G200 jsou grafické karty postavené na čipu G80

(např. Geforce 8800GT a 8800GTX) a G 92( např.9800GTX ). V tabulce níže je

porovnání karet 8800GTX s GTX280

Grafické karty postavené na jádru G200 se zatím nabízí ve 2 variantách.

Výkonnější GTX280 a méně výkonná GTX260. GTX 260 je postavená na úplně

stejné architektuře, pouze má omezené některé jednotky. Výkon je tak uměle

snížen.

G200 je vyráběná 65nm technologií. Na jádro o velikosti 24mm x 24mm

dokázali technici v Nvidii umístit 1,4 miliard tranzistorů. Pro zajímavost G80

měla něco kolem 681 milionů a jádro G92 754 milionů. Což znamená že jádro

G200 má skoro dvojnásobný počet tranzistorů oproti G92.

Hlavní přínosy G200

Unifikovaná architektura druhé generace

Integrovaná PhysX

Multi-GPU SLI a Tri-SLI

Podpora DirectX 10

Shader Model 4.0.

Jazyk CUDA

PCI Express 2.0

Giga Thread Technologie – paralelní zpracování operací

Lumenex engine - velmi přesné zobrazení objektů.

128-bitové HDR osvětlení - slibuje dvakrát kvalitnější světelné efekty.

Dual Link a Display Port - Přes obě rozhraní je možné zobrazit digitálně

rozlišení až 2560x1600

Pure Video HD - Dva HD dekodéry dokáží zobrazit dva HD streamy

zároveň.

Vylepšené režimy spotřeby

Architektura

Na obrázku níže je zobrazeno zjednodušené schéma procesoru G200. Zobrazení hlavně představuje tok dat od thread Schedule(řídí plánování úloh, které jsou poté zpracovány v clusterech jádra) až po ROPs (Render Output unit - zabezpečuje výstup dat z grafické karty) , kde se finální pixely dostávají do frame bufferu a jsou následně zobrazené na vaší obrazovce. Jedná se o architekturu druhé generace. Díky vylepšenému komunikačnímu protokolu má G200 rychlejší a lepší přenos informací v jádru. Vylepšení také doznalo plánování mezi TMUs (Texture mapping unit - mapuje textury na objekty) a SM řadičem.

V jádru se využívají 2 modely zpracování údajů:

MIMD (multiple instruction, multiple data) v případe jednotlivých clusterů

SIMT (single instruction, multiple thread) v jednotlivých SMs.

TP CLUSTER

Celkově se v jádru nachází 10 thread processing clusterů (na obrázku) Každý jeden cluster je sestaven ze :

1. Tří streaming multiprocessors (SMs), 2. z osmi texturovacích jednotek (TMUs) složených z 8 filtrovacích

(TFUs), 8 adresovacích jednotek (TAUs) 3. a lokální paměti L1 cache.

Úkolem paměti cache, která se nachází mezi jednotlivými ALUs je uchování jednotlivých informací , které si ALUs vyměňují mezi sebou bez toho,aniž by museli přistupovat na externí paměťový systém.

FAKTA o G200

Vyšší výkon při zpracování textur

G200obsahuje v každém clusteru dvě texturovací jednotky skládající se z 2x4 filtrovacích a 2x4 adresovacích jednotek, které dokáží za takt filtrovat a adresovat osm bilineárně filtrovaných pixelů a nebo čtyři: 2x anizotropní filtrované pixely.

Více úloh najednou

Jelikož je u her potřeba zvýšit aritmetický výkon , nemusela nVidia nijak razantně zvětšovat počet TMUs ale ALUs. G200 obsahuje 240 tzv. „stream procesorů“ . K navýšení úloh také pomohl jazyk CUDA o kterém bude zmínka za chvíli.

G200 vs G80

Vyšší přesnost operací v plovoucí desetinné čárce - nutné pro výpočty Vyšší frekvence jádra i pamětí Téměř 2x více SP procesorů Možnost třikrát vyššího počtu spuštěných paralelních úloh 1GB pamětí + 512-bit paměťová sběrnice Plná rychlost ROP jednotek Dvakrát delší velikost registrů - vyšší efektivita a výkon Několikrát rychlejší geometry shadery Efektivnější plánovač instrukcí, vyšší výkon při zpracování textur Vylepšený "z-cull" a komprese, vyšší výkon při vysokých rozlišeních

CUDA

CUDA je unifikovaná architektura druhé generace umožňující využít u

grafických karet jejich GPU nejen pro hry, ale i pro složité výpočty.

Cuda je postavena na bázi jazyka C a C++ tak, aby umožnila programování

jednoduchých SP jednotek v GPU. Hlavní předností , kterou si CUDA kladla za cíl

je paralelizace prováděných úloh tak ,aby využila výpočetní možnosti GPU na

maximum a bezezbytku. Princip je jednoduchý. CPU zpracovává vlákno

programu a při potřebě výpočtu předá tento úkol právě GPU. V případě, že

program je napsaný pro jedno vlákno spustí jej CUDA na všech SP procesorech

a tím proces paralelizuje. Tedy i když bude aplikace napsaná na jedno vlákno a

spustí se na GPU, stane se z ní více vláknová.

CPU vs GPU

Běžné procesory spouští 2 vlákna instrukcí. Ty se snaží provádět jednu za

druhou v co nejkratším čase.

V současnosti je největší problém v tom, že aplikace jsou psané pro jedno

vlákno nikoliv pro více. Jediné více vláknové aplikace jsou hry, editory videa,

encodery,simulace, fotografií.

GPU je ve skutečnosti mnoho jádrový multiprocesor. Ten je v jednom okamžiku

schopen provést několik instrukcí najednou. Například čtyř jádrový procesor

provede v jednom okamžiku jen několik instrukcí oproti tomu GPU provede až

100vky instrukcí. Čtyř jádrové CPU může navíc provádět jen 8 vláken, zatím co

GPU jich může mít až tisíc. GPU nebude nikdy nahrazovat CPU. Už jen proto, že

účel GPU je směrován jedním směrem a podle toho je i vybavena jeho

instrukční sada. Ve výpočtech s plovoucí desetinnou čárkou však nemají GPU

konkurenci.

Velký význam mají GPU pro astro-fyzikální, lékařské, letecké apod. simulace a

výpočty. Objevují se i první reálně využitelné aplikace ku prospěchu všech,

například software pro výpočet obrazu u mamografů, modelů tomografů a

dalších. Na obrázku níže můžete sledovat rozdíl ve zpracování videa HD nebo

výpočtu PhysiX.

Závěr

Grafický chip společnosti Nvidia rozhodně přinesl mnoho nových aspektů a

technik do světa obrazu a grafiky. Díky vylepšené technologii, je možné

zpracovávat rychleji video, lékařské snímky a nebo simulace jakéhokoliv typu.

Novinka sebou také přinesla snížení spotřeby energie, možnost zapojit kartu do

DUAL,TRI SLI režimu nebo Pure video HD. GPU s Cuda má velký potenciál, který

se bude dále rozšiřovat.

Zdroje

http://pctuning.tyden.cz/

http://cs.wikipedia.org/wiki/GeForce_200

http://www.nvidia.com/content/global/global.php

http://pctuning.tyden.cz/

http://cs.wikipedia.org/wiki/GeForce_200

http://www.nvidia.com/content/global/global.php

Documents

NVIDIA G200 - wh.cs.vsb.czwh.cs.vsb.cz/mil051/images/2/28/PAP_Představení_grafického_procesoru...UDA je unifikovaná architektura druhé generace umožňující využít u grafických