Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
Historie a předchůdci G200
V červnu roku 2008 spatřila světlo světa nová grafická karta od společnosti
Nvidia. Tato grafická karta opět posunula veškeré chápání grafiky o kus dál a
přináší tak mnohem věrohodnější, rychlejší a lepší zpracování obrazu. Její vývoj
trval bezmála 4 roky. Výsledek snažení skutečně stojí za to.
Předchůdcem grafického čipu G200 jsou grafické karty postavené na čipu G80
(např. Geforce 8800GT a 8800GTX) a G 92( např.9800GTX ). V tabulce níže je
porovnání karet 8800GTX s GTX280
Grafické karty postavené na jádru G200 se zatím nabízí ve 2 variantách.
Výkonnější GTX280 a méně výkonná GTX260. GTX 260 je postavená na úplně
stejné architektuře, pouze má omezené některé jednotky. Výkon je tak uměle
snížen.
G200 je vyráběná 65nm technologií. Na jádro o velikosti 24mm x 24mm
dokázali technici v Nvidii umístit 1,4 miliard tranzistorů. Pro zajímavost G80
měla něco kolem 681 milionů a jádro G92 754 milionů. Což znamená že jádro
G200 má skoro dvojnásobný počet tranzistorů oproti G92.
Hlavní přínosy G200
Unifikovaná architektura druhé generace
Integrovaná PhysX
Multi-GPU SLI a Tri-SLI
Podpora DirectX 10
Shader Model 4.0.
Jazyk CUDA
PCI Express 2.0
Giga Thread Technologie – paralelní zpracování operací
Lumenex engine - velmi přesné zobrazení objektů.
128-bitové HDR osvětlení - slibuje dvakrát kvalitnější světelné efekty.
Dual Link a Display Port - Přes obě rozhraní je možné zobrazit digitálně
rozlišení až 2560x1600
Pure Video HD - Dva HD dekodéry dokáží zobrazit dva HD streamy
zároveň.
Vylepšené režimy spotřeby
Architektura
Na obrázku níže je zobrazeno zjednodušené schéma procesoru G200. Zobrazení hlavně představuje tok dat od thread Schedule(řídí plánování úloh, které jsou poté zpracovány v clusterech jádra) až po ROPs (Render Output unit - zabezpečuje výstup dat z grafické karty) , kde se finální pixely dostávají do frame bufferu a jsou následně zobrazené na vaší obrazovce. Jedná se o architekturu druhé generace. Díky vylepšenému komunikačnímu protokolu má G200 rychlejší a lepší přenos informací v jádru. Vylepšení také doznalo plánování mezi TMUs (Texture mapping unit - mapuje textury na objekty) a SM řadičem.
V jádru se využívají 2 modely zpracování údajů:
MIMD (multiple instruction, multiple data) v případe jednotlivých clusterů
SIMT (single instruction, multiple thread) v jednotlivých SMs.
TP CLUSTER
Celkově se v jádru nachází 10 thread processing clusterů (na obrázku) Každý jeden cluster je sestaven ze :
1. Tří streaming multiprocessors (SMs), 2. z osmi texturovacích jednotek (TMUs) složených z 8 filtrovacích
(TFUs), 8 adresovacích jednotek (TAUs) 3. a lokální paměti L1 cache.
Úkolem paměti cache, která se nachází mezi jednotlivými ALUs je uchování jednotlivých informací , které si ALUs vyměňují mezi sebou bez toho,aniž by museli přistupovat na externí paměťový systém.
FAKTA o G200
Vyšší výkon při zpracování textur
G200obsahuje v každém clusteru dvě texturovací jednotky skládající se z 2x4 filtrovacích a 2x4 adresovacích jednotek, které dokáží za takt filtrovat a adresovat osm bilineárně filtrovaných pixelů a nebo čtyři: 2x anizotropní filtrované pixely.
Více úloh najednou
Jelikož je u her potřeba zvýšit aritmetický výkon , nemusela nVidia nijak razantně zvětšovat počet TMUs ale ALUs. G200 obsahuje 240 tzv. „stream procesorů“ . K navýšení úloh také pomohl jazyk CUDA o kterém bude zmínka za chvíli.
G200 vs G80
Vyšší přesnost operací v plovoucí desetinné čárce - nutné pro výpočty Vyšší frekvence jádra i pamětí Téměř 2x více SP procesorů Možnost třikrát vyššího počtu spuštěných paralelních úloh 1GB pamětí + 512-bit paměťová sběrnice Plná rychlost ROP jednotek Dvakrát delší velikost registrů - vyšší efektivita a výkon Několikrát rychlejší geometry shadery Efektivnější plánovač instrukcí, vyšší výkon při zpracování textur Vylepšený "z-cull" a komprese, vyšší výkon při vysokých rozlišeních
CUDA
CUDA je unifikovaná architektura druhé generace umožňující využít u
grafických karet jejich GPU nejen pro hry, ale i pro složité výpočty.
Cuda je postavena na bázi jazyka C a C++ tak, aby umožnila programování
jednoduchých SP jednotek v GPU. Hlavní předností , kterou si CUDA kladla za cíl
je paralelizace prováděných úloh tak ,aby využila výpočetní možnosti GPU na
maximum a bezezbytku. Princip je jednoduchý. CPU zpracovává vlákno
programu a při potřebě výpočtu předá tento úkol právě GPU. V případě, že
program je napsaný pro jedno vlákno spustí jej CUDA na všech SP procesorech
a tím proces paralelizuje. Tedy i když bude aplikace napsaná na jedno vlákno a
spustí se na GPU, stane se z ní více vláknová.
CPU vs GPU
Běžné procesory spouští 2 vlákna instrukcí. Ty se snaží provádět jednu za
druhou v co nejkratším čase.
V současnosti je největší problém v tom, že aplikace jsou psané pro jedno
vlákno nikoliv pro více. Jediné více vláknové aplikace jsou hry, editory videa,
encodery,simulace, fotografií.
GPU je ve skutečnosti mnoho jádrový multiprocesor. Ten je v jednom okamžiku
schopen provést několik instrukcí najednou. Například čtyř jádrový procesor
provede v jednom okamžiku jen několik instrukcí oproti tomu GPU provede až
100vky instrukcí. Čtyř jádrové CPU může navíc provádět jen 8 vláken, zatím co
GPU jich může mít až tisíc. GPU nebude nikdy nahrazovat CPU. Už jen proto, že
účel GPU je směrován jedním směrem a podle toho je i vybavena jeho
instrukční sada. Ve výpočtech s plovoucí desetinnou čárkou však nemají GPU
konkurenci.
Velký význam mají GPU pro astro-fyzikální, lékařské, letecké apod. simulace a
výpočty. Objevují se i první reálně využitelné aplikace ku prospěchu všech,
například software pro výpočet obrazu u mamografů, modelů tomografů a
dalších. Na obrázku níže můžete sledovat rozdíl ve zpracování videa HD nebo
výpočtu PhysiX.
Závěr
Grafický chip společnosti Nvidia rozhodně přinesl mnoho nových aspektů a
technik do světa obrazu a grafiky. Díky vylepšené technologii, je možné
zpracovávat rychleji video, lékařské snímky a nebo simulace jakéhokoliv typu.
Novinka sebou také přinesla snížení spotřeby energie, možnost zapojit kartu do
DUAL,TRI SLI režimu nebo Pure video HD. GPU s Cuda má velký potenciál, který
se bude dále rozšiřovat.
Zdroje
http://pctuning.tyden.cz/
http://cs.wikipedia.org/wiki/GeForce_200
http://www.nvidia.com/content/global/global.php