24
지난 13GeForce 6800 Series전세계적으로 출시했던 NVIDIA에게 지난 2년은 악몽과 같은 시간이었을 것이다. GeForce256 출시 이후 그래픽 카드계의 지존으로 군림했던 NVIDIA기존의 성능 위주의 제품군에서 탈피하고자 새롭게 시도했던 GeForce FX Series NVIDIA성장에 발목을 잡았다. 사이 경쟁이 없을 같았던 전통의 명가 ATIR300 Series내놓으며 시장을 시켰을 뿐만 아니라, 이에 탄력을 받아 자사 칩셋의 범위를 메인보드 플랫폼, DTV 영역까 확장시켰다. 지난 23코엑딥블루에서 열렸GeForce 6 Series 표회 러나 자는 망해3년은 간다했던가? 절한 비유지라도 NVIDIA와신상담하며 새로Series준비했고 2004새로정상초절정 슈퍼 울트스펙타클 그래픽 카드를 내놓았다. 오늘 우리NVIDIA제품을 내놓으표한 GeForce 6 Series용된 키텍쳐NVIDIA문건살펴보고, DarkcrowGeForce 6800 Ultra모습3D 성능을 확인해볼 것이다. 서는 아래같다. l Introduction to GeForce 6 Series l GeForce 6 Series - Superscalar, Rotate-Grid Antialiasing l NVIDIA HPDR Technology l CineFX 3.0 I - Vertex Shader 3.0 l CineFX 3.0 II - Pixel Shader 3.0 l GeForce 6800 Ultra l Setup for Testing 3D Performance l 3D Permance I l 3D Performance II l Final Word

지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 NVIDIA에게 지난 2년은 악몽과도 같은 시간이었을 것이다. GeForce256 출시 이후 그래픽 카드계의 지존으로 군림했던 NVIDIA가 기존의 성능 위주의 제품군에서 탈피하고자 새롭게 시도했던 GeForce FX Series는 NVIDIA의 성장에 발목을 잡았다.

그 사이 경쟁이 될 수 없을 것 같았던 전통의 명가 ATI는 R300 Series를 내놓으며 시장을 역전 시켰을 뿐만 아니라, 이에 탄력을 받아 자사 칩셋의 범위를 메인보드 플랫폼, DTV 영역까지 확장시켰다.

지난 23일 코엑스 딥블루에서 열렸던 GeForce 6 Series 발표회 중

그러나 부자는 망해도 3년은 간다했던가? 적절한 비유는 아닐지라도 NVIDIA는 와신상담하며 새로운 Series를 준비했고 마침내 2004년 새로운 정상의 탈환을 위한 초절정 슈퍼 울트라 스펙타클 그래픽 카드를 내놓았다.

오늘 우리는 NVIDIA가 이번 신제품을 내놓으면서 발표한 신기술과 GeForce 6 Series에 적용된 아키텍쳐를 NVIDIA의 문건을 통해 살펴보고, Darkcrow에 입수된 GeForce 6800 Ultra의 실제 모습과 3D 성능을 확인해볼 것이다. 글의 순서는 아래와 같다.

l Introduction to GeForce 6 Series l GeForce 6 Series - Superscalar, Rotate-Grid Antialiasing l NVIDIA HPDR Technology l CineFX 3.0 I - Vertex Shader 3.0 l CineFX 3.0 II - Pixel Shader 3.0 l GeForce 6800 Ultra l Setup for Testing 3D Performance l 3D Permance I l 3D Performance II l Final Word

Page 2: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

NVIDIA GeForce 6 Series는 고품질 이미징의 성능과 정밀도를 보다 높여, 개발자들이 놀라운 실시간 효과를 낼 수 있도록 한다. 이 차세대 GPU는 사이클 당 더 많은 연산을 지원하는 혁신적인 슈퍼스칼라 아키텍처를 도입하여 이미지 효과의 수준을 높이는 반면, 품질과 속도간 트레이드오프를 할 필요 없게 해준다. GeForce 6 Series는 모든 파이프라인에 32비트 부동소수점을 완벽하게 지원함으로써 128비트 컬러 시네마틱 이미지를 만들어낸다. 프로그래머들은 메모리를 보다 효율적으로 사용하고자 할 경우에는 16비트 포맷으로, 액션 혹은 주요장면처럼 보다 선명하고 강력한 효과를 원할 경우 에는 풀(full) 정밀도로 쉽게 전환할 수 있다.

GeForce 6 Series 아키텍처의 일부이자 Light & Magic(http://www.openexr.com)의 OpenEXR 표준에 기반한 새로운 NVIDIA HPDR (High-Precision Dynamic-Range) 기술은 정적화질과 동적화질 모두를 한층 향상시켜준다. NVIDIA HPDR을 사용하면 동작은 자연스러워지고 텍스처 디테일은 증가한다. GeForce 6 Series 제품은 유효 서브픽셀 커버리지 값을 보다 많이 지원함으로써 폴리곤 에지(polygon edge)를 지원하는 새로운 회전 그리드 안티앨리어싱 시스템도 포함하고 있다. 따라서 폴리곤 에지를 보다 선명하고 또렷하게 해주는 정교한 픽셀 컬러 표시가 가능하게 되었다.

여기에서는 NVIDIA GeForce 6 Series 아키텍처, 첨단 화질, 그리고 이 제품이 지원하는 효과 및 기법을 살펴보고자 한다.

슈퍼스칼라 설계

NVIDIA GeForce 6 Series는 사이클 당 실행 연산 수를 두 배로 증가시켜주는 혁신적인 쉐이더 아키텍처를 기반으로 한다. (그림1, 2 참고) 픽셀 당 쉐이딩 유닛이 2개이기 때문에 어떤 사이클에서나 2배로 증가된 픽셀 연산을 제공한다. 이러한 성능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서 급변하는 게임 환경이나 다른 실시간 인터랙티브 애플리케이션에서 새로운 차원의 정교한 이미지와 뛰어난 비주얼 효과를 실현할 수 있게 되었다.

GeForce 6 Series 아키텍처는 쉐이더 유닛 2개와 함께 진정한 의미의 듀얼 프로세싱 (서로 다른 쉐이더 유닛에서 두 개의 명령어가 같은 사이클에서 실행)을 지원한다. 일부 설계자들은 동일 사이클 내에서 2개 명령어를 지원할 수 있다고 주장함으로써 단일 쉐이더 논스칼라 설계의 위상을 높이려 하지만, 이 두 접근방식은 매우 다르다. 단일 쉐이더 아키텍처의 경우,

Page 3: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

동일 쉐이더 유닛에서 명령어 2개만 실행되며 (그림 3 참고) 이 명령어들은 동일 워드 혹은 픽셀의 컴포넌트에서 작동한다. 반면, GeForce 6 Series 아키텍처는 픽셀 컴포넌트에서 수행되는 수학적 계산을 위해 더 많은 트루풋을 제공한다. 각 사이클에서 듀얼 쉐이더 유닛은 사이클 당 명령어를 최대 4개, 픽셀 당 연산을 최대 8개까지 실행할 수 있다.

l Note : “명령어(instructions)”는 하드웨어에 제공되는 명령(commands)으로, 한 픽셀의 여러 컴포넌트에서 작동할 수 있으며 다수의 연산을 요한다. “연산(operations)”은 명령어 실행을 위해 수행되는 수학 기능을 말한다.

GeForce 6 Series 아키텍처는 트루풋을 향상시켜줄 뿐 아니라 프로그래밍 융통성을 높여준다. 픽셀 컴포넌트는 하나씩 개별적으로, 혹은 연산 당 2, 3, 4개 컴포넌트로 구성된 그룹으로 동작할 수 있다. 그룹핑을 정의하는 이러한 기능은 여러 프로그래밍 신기법을 지원하며 다음 세대를 버전을 구성할 복소수 수학연산의 속도를 높여준다.

요약하자면, 슈퍼스칼라 아키텍처는 픽셀당 4개의 명령어와 8개의 연산을 처리할 수 있다. (기존 아키텍처에서는 명령어 2개, 연산 4개 처리) <그림 3>은 기존의 아키텍처 (그림 좌측)에서는 각 연산의 픽셀 부품 그룹핑이 한정되어 있기 때문에 한 사이클에서 픽셀당 명령어를 2개 밖에 처리하지 못하는 이유를 보여준다. 반면 NVIDIA의 슈퍼스칼라 아키텍처 (그림 우측)에서는 픽셀 컴포넌트의 그룹핑 시 충분한 융통성을 발휘하여 각 사이클에서 픽셀 당 명령어를 4개까지 처리할 수 있다.

새로운 효과의 시대

새로운 GeForce 6 Series GPU의 슈퍼스칼라 아키텍처는 다양한 이미징 연산과 효과 측면에서 속도와 정밀도를 크게 높여준다. 이는 네이티브 32비트 파이프라인 및 이미징 발전을 통해 가능해졌다. 실시간 애플리케이션과 게임에서 처음으로 각종 연산이 실용화되면서 (텍스처 필터링, 고도의 다이나믹 레인지 효과, 심도, 블러, 16x 이방성 필터링), PC에 사실감과 시네마틱 리얼리즘을 제공할 수 있게 되었다.

Page 4: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

32-Bit 네이티브

GeForce 아키텍처는 개발자들로 하여금 각 이미지나 장면에 적합한 정밀도 레벨을 선택할 수 있게 해준다. 이제 선택은 더 쉬워졌다. 풀 32비트 부동소수점 정밀도와 관련된 성능저하 문제가 해결되었기 때문이다. 메모리 공간의 효율적 사용이 우선이라면 16비트 모드를, 더 높은 수준의 이미지를 구현하고자 할 경우에는 32비트 모드를 통해 보다 광범위한 실시간 상황에서 성능을 향상시킬 수 있다. 이로써 사용자들은 보다 풍부하고 생생한 그래픽 익스피어리언스를 갖게 되고, 게임 개발자들은 경쟁사와의 차별화를 꾀할 수 있다.

회전 그리드 안티앨리어싱 (Roated-Grid Antialiasing)

최신 NVIDIA GeForce GPU 제품은 회전 그리드 안티앨리어싱 샘플링 알고리즘을 채택하고 있다. 이 새로운 설계방법은 픽셀 당 4개 샘플을 기준으로 업계 최고의 성능을 유지하는 한편, 컬러 정확성은 대폭 높였다. 종전에는 4개의 서브픽셀이 각 픽셀 당 2x2 그리드 패턴으로 샘플링 되었는데, 새로운 안티앨리어싱 설계에서는 4개 서브픽셀 패턴을 약간 회전시킴으로써 4x4 다이아몬드형 격자로 샘플링을 하고 있다. 아래 그림은 GeForce 6 Series 서브픽셀 패턴(우측)이 어떻게 다이아모드 형으로 회전되었는지 보여주고 있다.

회전 그리드 컨피규레이션은 수평 및 수직 차원에서 뛰어난 서브픽셀 커버리지를 지원한다. 위 그림에서 보면, GeForce FX 아키텍처는 2개의 수직값과 2개의 수평값을 위한 커버리지를 제공하지만 GeForce 6 Series 커버리지는 수평 및 수직 서브픽셀 포지션을 위한 4개 값으로 확장된다. 커버리지가 증가하면 폴리곤 에지에서 보다 정확한 컬러를 제공할 수 있다.

안티앨리어싱 및 샘플링 기법에 관한 보다 자세한 정보는 NVIDIA 기술자료 “NVIDIA Accuview Technology: High-Resolution Antialiasing Subsystem (TB-00311-001)”를 통해 얻을 수 있다. (www.nvidia.com)

● ●

● ●

Page 5: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

NVIDIA HPDR 기술

NVIDIA HPDR 기술의 사용으로 보다 실감나는 그래픽을 연출할 수 있다. 이러한 HDR (high dynamic range) 렌더링을 통해 사용자들은 <그림 4>에 표현된 어두운 이미지의 다양한 컬러와 태양광선의 강한 밝기 등 현실감 있는 효과와 환경을 체험할 수 있다.

종전에는 이러한 형태의 렌더링을 하는데 제한이 많았다. 컴퓨터 프레임 버퍼는 다양한 컬러강도에 맞는 선형 리니어 디스플레이 스케일을 가지고 있었다. 또한 표준인 32-bit-per-pixel 프레임 버퍼는 전체 컬러 범위를 표현하는데 있어서 225개의 값만을 지원하여 다이내믹한 이미지 표현에는 역부족이었다. 따라서 개발자들이 이러한 그래픽을 제공하려면 별도의 솔루션을 개발해야 했다. 이러한 솔루션의 예로는 픽셀 쉐이더에서 값비싼 컨버전 (RGBE) 사용, 호환되지 않는 기술들은 함께 사용하지 않기 (예: 다이내믹 라이팅), 그래픽 하드웨어에 빠진 기능을 에뮬레이팅 (예: 고정밀 텍스처 필터링) 하는 방법 등이 있었다.

GeForce 6 Series 아키텍처는 매우 강력한 고도의 다이나믹 레인지 렌더링 기술을 충족시켜주는 NVIDIA HPDR 기술을 특징으로 한다. NVIDIA HPDR은 정적 및 동적 이미지의 쉐이딩, 블렌딩, 필터링 작동 과정에서 탁월한 데이터 정밀성을 제공한다.

NVIDIA HPDR을 사용하면 고도의 동적범위 렌더링을 능률적으로 구현할 수 있다. 이러한 렌더링 작업은 라이트 트랜스포트 (light transport), 톤 매핑 (tone mapping), 컬러 및 감마 정정 (color and gamma correction) 등 3단계로 나뉜다.

1. Light Transport

라이트 트랜스포트는 지오메트리, 텍스처 맵, 라이트 포지션, 라이트 래디언스 (light radiance)를 받아들이고, 가시 표면을 기준으로 반사광에 대해 픽셀당 고도의 다이내믹 래디언스 값을 출력하는 과정이다. 이러한 정보는 빛의 밝기 값을 광범위하게 표현하는데 충분한 정밀도와 범위를 갖춘 프레임 버퍼에 저장되어야 한다. 유지할 수 있는 범위가 크면 클수록 데이터가 저장될 수 있는 정밀도는 높아지며, 비주얼 결과도 보다 정확해진다.

NVIDIA HPDR은 OpenEXR 표준인 SM10e5 와 동일한 인코딩 방법을 따른다. 즉, 광전송 정보를 표시하는데 1 사인비트, 10비트 가수, 5비트 지수가 사용된다. e와 m의 값에 따라 이 강력한 포맷의 범위를 알 수 있다.

Page 6: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

l Note: 이 예에서 다이나믹 레인지=12dB, 최대 값은 65504, 최소값은 2-24

이 같은 범위 및 정밀도는 라이트 트랜스포트 데이터의 방대한 범위와 정밀도를 정확하게 포착하는데 필요하다.

2. Tone Mapping

이제 라이트 트랜스포트 단계의 출력데이터가 컬러 값에 매핑되며 2D 이미지에서 동작한다. 이러한 과정을 톤 매핑이라고 한다.

3. Color and Gamma Correction

컬러 및 감마정정으로 불리는 이 마지막 단계에서는 앞에서 나온 컬러 값을 표준 '컬러영역' (red, green, blue로 정의)으로부터 모니터의 R, G, B '컬러영역'으로 매핑한다. 또한 이렇게 렌더링 초기 단계에 계산된 컬러강도의 대수차가 최종 디스플레이 디바이스에 도달할 수 있도록 감마 정정을 적용한다.

인간의 눈은 빛에 대수적으로 반응한다. 사실 인간의 눈은 빛의 세기가 약할수록 더 민감해지기 때문에 빛의 세기나 밝기가 강할 때 보다 훨씬 자세히 어두운 쉐이드를 볼 수 있다. 이 최종단계에서는 적절한 비주얼 효과를 유지하면서 데이터를 모니터에 매핑한다.

NVIDIA HPDR Rendering을 위한 GPU 요건

GPU가 이러한 유형의 렌더링 접근방식을 실행하기 위해서는 부동소수점 쉐이딩, 블렌딩, 필터링, 텍스처링 등의 기능을 갖추어야 한다. 또한 데이터의 대수적 본질을 유지하기 위해서는 컬러를 저장할 수 있어야 한다.

부동소수점 쉐이딩 (Floating Point Shading)

앞서 언급한 대로 32비트 쉐이딩은 GeForce 6 Series GPU 본래의 연산모드로, 쉐이딩 연산을 최고 속도와 정밀도로 실행할 수 있다. 물리적으로 정확한 조명, 무지개 빛 (iridescence), 서브서피스 스케터링 (subsurface scattering) 같은 효과를 속도 저하 없이 훌륭하게 렌더링 할 수 있다.

부동소수점 블렌딩 (Floating Point Blending)

블렌딩 연산은 이전에 렌더링 된 픽셀과 각 위치에 존재하는 새로 계산한 프래그먼트(fragment) 값의 합이다. 렌더링 효과에 따라 이 값은 최종 컬러 값을 내기 위해 합산된다. 정밀도가 높으면 높을수록 혼합 픽셀의 품질은 더 정확해지고 높아진다.

부동소수점 블렌딩을 활용한 효과로는 모션 블러 (motion blur), 소프트 쉐도우, 한 화면에 있는 여러 동적 빛 계산을 통한 합산 등이 있다.

부동소수점 필터링 (Floating Point Filtering)

필터링 연산은 픽셀을 필터링하여 화면 내의 사물이나 평활 에지를 보다 뚜렷하게 해준다. 필터링은 바이리니어(bilinear) 및 트라이리니어 (trilinear) 필터링을 사용할 때처럼 동작 중의 비주얼을 향상시켜준다. 또한 익스트림(extreme) 가시각에서 픽셀이 사물을 묘사할 때에도 화질을 보다 선명하게 할 수 있다(애니소트로픽 필터링). 그 밖의 부동소수점 필터링 효과로는 톤 매핑과 글로(glow)가 있으며 이는 고도의 동작 범위 렌더링에 필수이다. 또한 NVIDIA GeForce 6 Series GPU는 보다 높은 수준의 정밀도와 16x 애니소트로픽 필터링을 지원한다.

부동소수점 텍스처링 (Floating Point Texturing) : 텍스처링 연산은 텍스처를 주어진 폴리곤에 적용한다. 부동소수점 텍스처는 전방향 쉐도우 맵, 심도(depth of field), 래이 트레이싱(ray tracing) 같은 독특한 효과를 지원한다.

Page 7: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

위 그림에서 좌측은 고도 다이나믹 레인지 없이 찍은 것은 이미지다. 빛의 강도 차이는 100:1에 불과하고 그 결과 창과 바닥의 명암에 별 차이가 없다. 우측 이미지는 HDR(high dynamic range)로 촬영되었으며 빛의 강도 차이가 9000:1 이상이다. 우측 이미지의 바닥과 자연 풍경의 정교한 명암 변화에 주목하자

Storing Colors

감가정정 중에 컬러 값을 매핑하는 기능은 고도 다이내믹 렌더링 기법의 핵심이다. 광범위한 값을 유지하기 위해서는 일부 대수형태가 채택되어야 한다.

8비트 감가 컬러 영역인 sRGB는 마이크로소프트 윈도우 운영체제를 위한 표준으로, CRT에 적합한 저가형 솔루션이며, GeForce 하드웨어로 구현된다. 하지만 sRGB 자체만으로는 충분치 않다. sRGB가 데이터의 대수표현을 제공하기는 하지만 렌더링의 라이트 트랜스포트 단계 중에 계산된 데이터를 정확하게 표시하기에는 범위나 정확도가 충분하지 않기 때문이다.

최근 첨단 게임에서는 “다이내믹 라이팅 (dynamic lighting)”이라는 기법이 사용된다. 이 기법에서 각 빛의 반사 및 다이나믹 레인지 데이터는 별도로 계산된 다음 버퍼에서 합산된다. 하지만 안타깝게도 sRGB 값은 합산될 수 없기 때문에, sRGB 값을 변환 및 추가한 다음 sRGB 포맷으로 다시 변환해야 한다. 이 경우 성능이 저하되며 다른 포맷으로의 변환이 되지 않을 경우에는 볼품 없는 가공품이 나오게 된다.

NVIDIA HPDR 기술은 HDR 렌더링 문제를 해결해준다. 이 기술은 라이트 트랜스포트 단계 중에 스토리지, 블렌딩, 쉐이딩, 텍스처링, 필터링을 위한 스튜디오 품질의 16비트 부동소수점 포맷을 제공한다. 또한 톤 매핑, 컬러 및 감마 정정 단계에서 효율적으로 sRGB 포맷 사용하도록 지원한다.

“실생활에서 보여지는 방대한 색과 빛을 어떻게 정확하게 표현하느냐는 컴퓨터 그래픽의 최대 과제였습니다. NVIDIA는 부동소수점 텍스처, 부동소수점 블렌딩, sRGB 감마 정정 등을 완벽하게 지원하기 때문에, 이제는 HDR 렌더링에서 정확한 색과 조명을 쉽게 구현할 수 있습니다.- 허브 마셀라스 (Herb Marselas), Emogence, LLC 기술 이사"

무엇보다도 NVIDIA HPDRF 기술이 하드웨어로 구현되기 때문에 픽셀 쉐이더 인코드나 디코드를 따로 처리할 필요가 없다. 이는 이미 마이크로소프트 다이렉트X® 9.0 및 OpenGL® API에 적용되고 있다.

Non HDR HDR

Range Precision Storage Notes RGBE 76.8 dB 9-bit log 189.8 Mb Radiance-compressed 32bit float 32-Bit TIFF 76.8 dB 24-bit log 759.4 Mb IEEE-754 32-bit FP OpenEXR 12.0 dB 11-bit log 379.7 Mb ILM-developed 16-bit FP e-sRGB 12 4.6 dB 12-bit poly 213.6 Mb Clamped at [-0.53..1.68] 160Bit int 4.8 dB 16-bit linear 379.7 Mb Clamped at [0..1] sRGB 3.5 dB 8-bit poly 189.8 Mb Clamped at [0..1] RGBA 2.4 dB 8-bit linear 189.8 Mb Clamped at [0..1]

Page 8: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

CineFX 3.0 The Next Wave of Stunning Visual Effects

제 3세대 NVIDIA® CineFX™ 엔진은 NVIDIA GeForce 6 Series GPU가 최대한의 성능을 발휘할 수 있도록 돕고, 새로운 PC 게임 개발 시 비주얼 효과 제작과정을 단순화시켜 준다. 프로그래머는 마이크로소프트의 DirectX 9.0 쉐이더 모델 3.0 및 SGI의 OpenGL 1.5 소프트웨어를 통해, 하드웨어에 의한 길이제한 없이 쉐이더 프로그램을 개발할 수 있다. 또한 개발자들은 MRT (Multiple Render Targets) 기술이나 향상된 플로우 컨트롤 옵션 등을 이용, 차세대시네마틱 특수효과를 제작할 수 있다. CineFX 3.0의 파워를 활용하면 성능저하 없이도 혁신적인 비주얼 익스피어리언스를 가져오는 이러한 효과들을 만들어 낼 수 있다.

CineFX 3.0 엔진은 업계 최초로 전체 파이프라인에 트루 32비트 쉐이딩 파워를 내장, 이전보다 월등한 프로세싱 능력을 제공한다. CineFX 3.0을 통해 프로그래머는 아주 복잡한 디지털 세계도 쉽게 구성할 수 있다. 게임 매니아의 예리한 눈으로도 구별하기 힘든 정교한 최첨단 실시간 효과 (Displacement Mapping, 복잡한 그림자, 실시간 피부 및 머리)도 모두 새로운 GeForce 6 Series로 구현할 수 있다.

새로운 표준들을 완벽하게 지원

NVIDIA는 다이렉트X 9.0, 버텍스 쉐이더 모델 3.0, 픽셀 쉐이더 모델 3.0, OpenGL 쉐이더 프로그램 컨벤션 등을 완벽히 지원한다. 따라서 게임 개발자들은 CineFX 3.0 엔진의 파워 및 정밀성을 손쉽게 이용할 수 있다. 또한 마이크로소프트 HLSL(High-Level Shader Language), OpenGLSL (OpenGL Shader Language), Cg 쉐이딩 환경 등 고도의 쉐이더 언어를 완벽하게 지원, 프로그래머들이 다이렉트X 혹은 OpenGL 인터페이스를 갖춘 게임을 개발할 수 있도록 돕는다.

Vertex Shader 3.0

NVIDIA CineFX 3.0은 사실상 무한길이 버텍스 프로그램과 DFC(Dynamic Flow Control)을 채택, 쉐이더 프로그램의 복잡성 및 구조 측면에서의 제한을 없앴다. 개발자들은 NVIDIA GeForce GPU의 놀라운 성능과 자유로운 프로그래밍을 바탕으로 Displacement Mapping, 버텍스 프로그램 스트림에 맞는 주파수 분할기 등 새로운 버텍스 쉐이더 기능을 활용할 수 있다.

Page 9: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

Infinite-Length Vertex 프로그램

버텍스 쉐이더 프로그램에서는 이제 길이 제한이 없어졌다. 종전에는 프로그림 길이 제한에 맞추기 위해 쉐이더 프로그램을 통합해 복합효과를 만들어냈었다. 또한 한 프로그램을 끝내고 새로운 프로그램을 시작할 때 오버헤드가 성능을 저하시켜, 게임속도를 떨어뜨리고 효과를 설정하기 어려운 경우가 종종 있었다.

하지만 이제 쉐이더 프로그램의 길이 제한이 없어져, 게임 플랫폼에서 최대한의 성능을 내기 위한 복합적인 효과를 만들 수 있게 되었다. 긴 프로그램이 짧은 프로그램에 비해 프로세싱 시간이 더 걸리는게 상식이지만, CineFX 3.0 엔진의 기술 및 속도로 긴 프로그램도 눈 깜짝할 사이에 실행될 수 있게 되었다.

Dynamic Flow Control

추가적인 루핑/브랜칭 (looping/branching) 옵션과 새로운 서브루틴 콜/리턴 (call/ return) 기능은 프로그래머들이 효율적으로 쉐이더 프로그램을 작성하도록 더욱 다양한 옵션을 준다. 길이 제한이 없고 플로우 컨트롤도 향상되면서 프로그래머들은 게임 세계에서 새로운 차원의 상상력과 창의력을 발휘하는 사상 초유의 자유를 누리게 되었다.

이러한 기능을 포함한 새로운 플로우 컨트롤은 다음과 같다.

l 새로운 명령어 (IFC/BREAKC, IF/BREAK/CALLNZ) l 반송 주소와 주소 등록을 위한 통합된 8-deep 스택 : Branch, call, Push, pop address

register l 컨디션 코드 선택

Displacement Mapping

프로그래머는 새로운 CineFX 3.0 기능 (텍스처와 함께 버텍스 프로세싱)을 활용하여 화면 내에 있는 모든 구성요소나 표면, 캐릭터에 깊이 (depth)와 리얼리즘을 더할 수 있게 되었다. 실시간으로 사용하기에 편리한 load-to-register 명령을 사용해 텍스처 정보를 버텍스에 매핑할 수 있다. Displacement Mapping으로 알려진 이 기법을 사용하면 픽셀 쉐이더 레벨 기법 (bump mapping 등)으로 작업하거나 3D 환경에 평활 표면으로 남겨둘 수 밖에 없는 평활면을 제거할 수 있다.

Displacement Mapping을 통해 컴퓨터로 만든 세계가 영화 수준으로 한 걸음 더 다가설 수 있게 되었다. 각 버텍스는 화면 내의 다양한 빛과 상호작용하기 때문에 모델의 지오메트리를 약간만 변경해도 비주얼에 미치는 영향은 매우 커진다. 또한 이전 3D 생성기법에 비해 계산 비용도 매우 적게 든다.

아래 그림은 Displacement Mapping 없는 초기 모델이다. 왼편 이미지는 3D 모델이 부분적으로 메시 하이라이트(mesh highlight) 된 공룡 머리를, 오른편 이미지는 같은 3D 모델에 머터리얼 칼라(material color)를 입힌 공룡 머리를 보여준다.

Page 10: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

모델의 메시를 Displacement Mapping하면, 공룡머리의 돌출부와 들어간 부분, 그리고 섬세한 텍스처 가 더해진다. 이 때 빛에 반응하는 디테일을 통해 사실적인 모습을 만들면서도 계산 비용은 거의 들지 않는다.

Vertex Frequency Stream Divider

CineFX 3.0을 사용할 경우 개발자들은 애니메이션이나 변위 정보 같은 상이한 형태의 버텍스 정보를 읽어 들이기 위해 다중 주파수 혹은 오프셋을 지정할 수 있다. 즉 각각의 대상에 개별성을 부여하면서도, 하나의 효과를 여러 인물이나 사물에 효율적으로 적용할 수 있다. 전장에 나가는 군 부대를 상상해보자. 이 때 개별 군인들은 나름의 동작을 취하고 있는데, 이 경우 각 카피에 개별 애니메이션 매개변수를 적용하면 군인들의 개성을 표현할 수 있다.

이러한 효과는 매우 쉽게 구현될 수 있다. 프로그래머는 애니메이션 매개변수를 화면상의 모든 모델에 배치(batch)함으로써, 전체 화면을 통해 생생한 비주얼 효과를 나타낼 수 있다.

Page 11: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

Pixel Shader 3.0

CineFX 기술의 발전으로 픽셀 쉐이더 기능이 버텍스 쉐이더 수준으로 향상되었다. 이제 픽셀 레벨의 컨트롤이 향상됨으로써, 게임을 보다 다양하게 개발하고 인물이나 사물, 그리고 화면에 살아있는 듯한 느낌을 추가할 수 있다.

또한 GeForce 6 Series GPU의 32비트 네이티브 프로세싱 기능은 전체 픽셀 쉐이딩 정밀도를 높여줘, 픽셀 쉐이더를 한 차원 높은 화질로 끌어올린다.

Infinite-Length Pixel Shaders

이제는 각 픽셀 쉐이더 프로그램을 96명령어로 제한할 필요가 없다. 하드웨어 제한에서 벗어나 보다 복합적인 효과를 픽셀 레벨에서 구현할 수 있다.

Dynamic Flow Control

루프 카운터 레지스터 (loop counter register)나 컨디션 코드 (condition code) 같은 브랜치 (branch), 루프 (loop), 서브루틴 (subroutine)을 완벽하게 지원하며, 새로운 백/페이스 레지스터 (back/face register)를 통해 완벽한 컨트롤이 가능하다.

유연한 데이터 지원

부동소수점 연산은 영화업계의 표준 포맷인 네이티브 32비트나 선택사양 16비트 포맷으로 처리될 수 있다. 두 모드 모두 동일한 성능을 제공하지만 32비트 부동소수점 모드는 피연산자(operand)를 저장하기 위해 메모리를 두 배 가량 사용한다. 프로그래머들은 원하는 수준의 정밀도를 얻기 위해 네이티브 32비트 모드나 선택사양 16비트 모드 중에서 선택할 수가 있다. 또한 공간 사용에 민감한 상황에서 메모리를 효과적으로 활용하고 관리할 수 있다. 이외에도 여타 데이터 포맷을 지원한다.

Multiple Render Targets

MRT 기술을 사용하면 픽셀 쉐이더가 픽셀당 데이터를 다중 버퍼로 저장할 수 있다. 이 경우 버퍼를 사진처럼 생생한 라이팅 쉐이터 용 매개변수로 사용할 수 있다. 이러한 접근방식에서 조명은 모든 지오메트리가 렌더링 된 후에 적용되며, 화면에서의 다중패스 없이 조명을 적용할 수 있다. 이를 지연 쉐이딩 (deferred shading)이라고 한다. 이 때 저장되는 전형적인 정보로는 포지션 (position), 노멀 (normal), 컬러 (color), 재료 (material) 등이 있다.

아래 그림은 동적범위가 큰 화면을 만드는데 사용되는 MRT 기법을 보여준다. 첫번째 렌더링 패스에서는 컬러맵 (color map), 표준맵 (normal map), 심도맵 (depth map) 등 세가지 출력 버퍼가 만들어진다. 두 번째 패스에서 조명은 빛의 조건에 따라 표준맵 및 심도맵을 통해 계산된다. 이 경우, 컬러맵과 함께 화면이 선명하게 나타난다.

Page 12: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

마지막으로 세 번째 패스에서는 0~1 범위 밖에 있는 초고강도 빛의 값이 화면에 적용된다. 이 계산에는 높은 명암도 픽셀 영역 주위에 생기는 픽셀 블루밍 (초점번짐)이 포함된다. 이러한 패스 결과는 최고 수준의 글로우 (glow) 효과이다.

MRT를 사용함으로써, 여러 패스를 절약하면서도 <그림 7>과 같은 뛰어난 화질의 최종 장면을 만들 수 있다. 픽셀 쉐이더가 점차 복잡해지면서 지연 쉐이딩을 구현하는 것이 보다 중요해지고 있다. 지연 쉐이딩은 이미지의 가시 영역에 있지 않은 픽셀들을 불필요하게 프로세싱하는 시간을 없애주기 때문이다.

추가적인 비주얼 효과

프로그래머들은 CineFX 3.0 엔진의 배가된 파워와 신기술을 활용해 종전 보다 훨씬 독특한 기능 및 효과를 만들어낼 수 있다. CineFX 3.0의 주요 특징은 다음과 같다.

l Subsurface scattering : 실감나는 반투명 효과를 나타내는 다양한 옵션으로 스킨 (표피) 및 표면에 깊이를 생성한다.

Color buffer

Depth buffer

Normal buffer of unlit scene

Result

Color map / Image combination

Final glow effect

Page 13: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

l Soft shadows : 소프트 쉐도우를 통해 그림자가 덜 거친 느낌을 갖는다. 화면에서 빛이나 대상으로부터 발생하는 그림자 테두리가 부드러워지면서 비주얼 룩을 보다 정확하게 표현한다.

l Environmental and ground shadows : 눈에 띄는 변형이나 성능저하 없이 풀이나 기타 식물 등이 포함되어 있는 배경 면에 그림자를 만들 수 있다. 32비트 파이프라인은 보는 사람의 시선에 따라 그라운드 그림자가 정확히 움직일 수 있도록 한다.

l Global illumination : 사전에 렌더링 된 그래픽과 실시간 그래픽의 가장 큰 차이점 중 하나는 바로 조명이다. 필름 렌더러는 최대한 실감나는 이미지를 만들기 위해 한 화면에서 물체들 간의 빛을 조정하는 방법을 결정하는데 많은 시간을 할애한다. 하지만 거의 무한 길이 픽셀 쉐이더와 부동소수점 필터링 및 블렌딩을 사용하면, 실시간에 가까운 놀라운 복합 효과가 실현되며, 실시간 애플리케이션에 보다 높은 수준의 포토리얼리즘을 얻을 수 있다.

UltraShadow II 와 GeForce 6 Series GPU

신제품 NVIDIA GeForce 6 Series (NVIDIA® GeForce™ 6 Series) 그래픽 프로세싱 유닛 (GPU)은 NVIDIA UltraShadow II (UltraShadow™) 기술을 기반으로 한다. UltraShadow 기술은 이머시브 (immersive) 환경에서 쉐도우 인터랙션을 결정하는 연산 속도를 높여 준다. UltraShadow II 기술을 통해 개발자들은 더욱 정밀한 조명 효과와 id Software의 Doom III 같은 차세대 게임에서 고도의 시네마틱 리얼리즘을 구현할 수 있다.

Page 14: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

향상된 쉐도우

실감나는 생생한 화면구성을 위해서는 정확한 그림자가 필수적이다. 다양한 빛 (light source)과 대상들이 복잡하게 상호작용하기 위해서는 다중 패스 프로그래밍이 필요하다. 각 프레임에서는 각각의 빛이 대상별로 분석되어야 한다.

개발자들은 NVIDIA의 UltraShadow II 기술 (특허출원 중)을 게임에 적용시킴으로써 멋진 비주얼 효과를 만들어낼 수 있다. 결과적으로 자사게임을 경쟁사와 확연히 구분 시켜주는 독특한 룩 (look)과 디지털 환경을 구성할 수 있다. 이는 렌더링의 빛과 그림자 패스 단계에서 성능이 향상되었기 때문으로, UltraShadow II는 개발자가 별도 작업을 하지 않고도 쉐도우 볼륨에 관련된 패스 성능을 이전 세대에 비해 4배 가량 높일 수 있다.

스텐실 쉐도우볼륨은 텍스처링이나 컬러 업데이트를 필요로 하지 않는다. UltraShadow II 하드웨어는 렌더링 성능을 배가시켜, 일반 픽셀 프로세싱 속도의 최고 2배로 스텐실 쉐도우 볼륨을 생성할 수 있다. 그 결과 개발자들은 별도의 코딩작업이 필요 없게 되었다. GeForce 6 Series 하드웨어는 쉐도우 볼륨 생성속도를 종전의 4배까지 높여줌으로써 이러한 새로운 접근방식이 가져오는 잇점을 돋보이게 한다. UltraShadow II 하드웨어에 2~3가지 콜을 추가할 경우 성능수준은 더욱 높아질 수 있다.

또한 NVIDIA UltraShadow II는 불필요한 고려 사항들을 제거, 프로그래머들이 그림자를 보다 빨리 계산할 수 있도록 돕는다. UltraShadow II를 통해 프로그래머들은 어떤 장면을 구역화된 영역 (depth bounds라고도 불림)으로 정의하여 나눌 수 있다. 이 구역화 된 영역에서는 빛 효과를 그 영역에 있는 대상에 한정시켜 계산하게 된다. 빛의 영향을 가장 많이 받는 영역으로 계산을 한정시킴으로써 전체 그림자 생성과정이 급격히 빨라지게 된다. <그림 2>는 빛과 그림자를 계산하는데 있어서 각 빛의 적정영역으로 한정시키기 위해 화면의 서브세트를 정의하는 방법을 보여준다.

Page 15: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

빛과 그림자를 계산할 때 각각의 빛이 닿는 영역으로 제한하기 위한 셋팅

프로그래머는 중요한 영역에서는 그림자를 미세조정하고, 실제와 거의 흡사한 비주얼라이제이션을 생성하며, 빠른 액션게임에 맞는 탁월한 성능을 구현할 수 있다. 또한 이러한 가속화된 그림자 생성기능 덕분에 시간이 오래 걸리는 다른 정밀효과에 더 많은 시간을 할애할 수 있게 된다.

아래 그림들은 UltraShadow II를 사용시 어떻게 검사를 요하는 쉐도우 영역을 대폭 줄일 수 있는지 방법을 보여주고 있다. UltraShadow II는 실제 쉐도우 픽셀을 컬링 (culling) 함으로써 성능을 높여준다. (하드웨어는 최종 이미지에 쓰이지 않는 쉐도우 픽셀은 무시한다)

Doom III의 플레이 장면

Page 16: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

UltraShadow II를 사용하지 않았을 경우

UltraShadow II를 사용했을 경우

UltraShadow II는 NVIDIA 인텔리샘플 3.0 (NVIDIA® Intellisample™ 3.0) 기술과 함께 동작하여 그림자의 에지를 적정수준으로 안티엘리어싱 (antialiasing) 시킨다. NVIDIA GeForce 6 Series GPU는 서브픽셀을 기반으로 스텐실 정보를 유지하며, 그 결과 블로키 (blocky) 혹은 재기 (jaggy) 룩을 막기 위해 그림자의 에지를 안티엘리어싱 할 수 있다.

Application

NVIDIA GeForce 6 Series GPU는 UltraShadow II 기술과 함께 차세대 게임효과를 지원한다. 게임 혹은 애플리케이션에서 그림자를 계산할 경우 UltraShadow II는 항상 전체 애플리케이션 성능을 높여준다. 빛과 그림자를 계산하는데 필요한 경로가 많으면 많을수록 (예를 들어 빛과 대상이 복잡한 장면) 성능은 보다 향상되어, 복잡한 장면도 말끔히 처리할 수 있다.

Page 17: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

GeForce 6 Series와 UltraShadow II를 통해, Doom III 같은 차세대 인기 게임의 속도는 훨씬 빨라질 수 있다.

NVIDIA GeForce 6 GPU Architecture Final word

NVIDIA GeForce 6 Series는 차세대 첨단 그래픽 애플리케이션에 사상 초유의 리얼리즘을 제공한다. 개발자는 이제 화질을 높이기 위해 속도를 저하시킬 필요 없이 복잡한 화면과 디지털 세계 전반에서 뛰어난 비주얼 효과를 구현할 수 있게 되었다.

NVIDIA HPDR 렌더링 같은 획기적인 혁신은 렌더링의 모든 측면 (쉐이딩, 텍스처링, 필터링, 블렌딩 등)에서 보다 높은 비주얼 품질과 독특한 효과를 제공한다. 회전 그리드 안티앨리어싱은 폴리곤 에지에서 더 높은 수준의 커버리지를 제공함으로써 전체 화질을 높여준다.

이 최신 아키텍처는 2D graphics, 2D textures with mipmaps, Cube maps, Volume maps, Shading, Texture filtering, Blending, Filtering과 같은 향상된 픽셀 파이프라인(표 2 참고)과 실시간 부동소수점 연산을 지원한다. 앞으로는 전문가들조차 컴퓨터로 만든 화면과 영화 장면을 구분하기가 쉽지 않은 시대가 올 것이다. NVIDIA GeForce 6 Series는 슈퍼스칼라 아키텍처, 32비트 네이티브 파이프라인, 최첨단 이미징 기능을 통해 가상세계에서 영화급 리얼리즘의 구현을 가로막는 마지막 장애물들을 타파해나가고 있다.

NVIDIA CineFX 3.0은 이제껏 경험할 수 없었던 수준의 프로그래밍 창의력을 발휘할 수 있도록 지원한다. 최신 GeForce GPU는 다이렉트X 쉐이더 모델 3.0을 완벽하게 지원함으로써 최고의 리얼리즘을 보여주는 차세대 게임, 매우 복잡하고 정교한 디지털 세계, 영화 수

Page 18: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

준의 환경에서 움직이는 실물과 흡사한 캐릭터 등을 지원한다.

이전에는 성능이나 정밀도를 저하시키지 않으면서, 이러한 고도의 효과를 지원한다는 것이 쉽지 않았다. 그 요인 중 하나는 다수의 연산패스가 필요로 하는 쉐이더 프로그램 때문이었다. 하지만 이제 NVIDIA GeForce 6 Series, NVIDIA CineFX 3.0, 다이렉트X 9.0 쉐이더 모델 3.0을 통해 성능을 저하시키지 않고도 획기적인 효과를 만들어낼 수 있게 되었다.

참고 : 2~6 페이지의 기술 자료와 관련된 저작권은 NVIDIA와 NVIDIA Korea에 있음. 무단 발췌 및 도용을 금함

Graphics to Drench Your Senses !

Page 19: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

사진을 클릭하면 전체 이미지의 동영상을 볼 수 있음

GeForce 6800 Ultra(NV40)는 NVIDIA의 자리를 다시 최고의 위치로 끌어올릴 새로운 그래픽 카드로, 반도체 업계 최초로 2억개 이상의 트랜지스터를 집적한 최고 집적율의 NV40 칩셋과, 앞으로 차세대 표준으로 자리잡을 GDDR3 메모리가 장착되었다. 특히, 2년간 유지해오던 FX라는 명칭을 없앤 것이 특이점인데, 이는 FX Series의 실패를 의미하며, 기존의 FX Series와는 확연히 구분되는 성능과 기능을 보일 것이라는 추측을 가능케 한다.

l 제품이름 : NVIDIA GeForce 6800 Ultra Eng Sample

l 코어 : NVIDIA NV40 eng

l 메모리 : Samsung 1.6ns ES BGA 256MB GDDR-3

l 메모리 버스 : 256비트(32MBx8) l 코어/메모리 속도 : 400MHz/1100MHz(DDR) l 출력부 구성 : 듀얼 DVI-I, VIVO

l Video : Pilips SAA7114H

l TMDS : Silicon Image Sil178CT64 X 2

l AGP 지원 : AGP 3.0 (8X, 4X) l API 지원 : DirectX 9.0c(Shader 3.0), OpenGL 1.5

l 번들 : 샘플

l 제조사/제조국 : NVIDIA /

Detail Layout

이전 NVIDIA 제품들에 비해 좀 더 최적화되고 스마트해진 외형을 보이고 있으며, 듀얼 DVI와 심플해진 전원부, 듀얼 외부 전원 단자, 쿨링을 위한 힛파이프가 눈에 들어온다. 실제 육중한 생김새로 굉장히 무거울 것 같지만, 이전 Ultra Series들에 비해 가볍다.

사진을 클릭하면 1600x1200 해상도의 사진을 볼 수 있음

뒷면엔 마치 고급 CPU 쿨러를 인상시키는 듯한 4핀 지지대가 붙어 있다. 아래 쿨링 솔루션에서도 언급하겠지만 이제 GPU도 CPU와 같은 취급을 받아야 할 시기가 온 듯하다. 2nd DVI

Page 20: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

출력을 위한 TMDS 칩셋이 뒷면에 장착되어 있으며, 앞으로 나올 512MB 버전을 위해 메모리가 부착된 반대면(사진의 면)에 메모리 장착 공간이 마련되어 있다.

카드 뒷면

아래 보이는 것이 NV40이라는 개발명을 가진 GeForce 6800 Ultra의 GPU이다. 약 2억 2천2백만개의 트랜지스터가 집적된 것으로 발표되어 현존하는 최고 개수의 트랜지스터가 집적된 단일 칩셋이다. 이로 인해 코어 크기도 이전에 비해 대폭 커졌으며, 이전까지 코어를 덮고 있던 힛스프레드도 없다.

NV40 엔지니어링 샘플

이번에 입수한 제품은 초기 엔지니어링 샘플로, 동작 클럭은 400MHz이다. 이전에 출시되었던 하이엔드 제품들이 500MHz 가까운 클럭을 지녔던 것에 비하면 동작 클럭이 많이 낮아진 것인데, 이는 거대해진 코어와 이에 따른 높은 발열로 인한 것으로 판단된다. 향후 공정이 숙련되고 발열이 해소된다면 좀 더 높은 클럭(500MHz~600MHz)으로 동작할 수도 있을 것이다.

2억 2천 2백만개의 트랜지스터가 내장된 NV40과 함께 새롭게 선보이는 GDDR3 메모리도

Page 21: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

눈여겨 볼 부분이다. 현재 GDDR3는 삼성과 마이크론에서 상용으로 공급되고 있으며, Hynix, Elpida, Infinion 등에서도 곧 상용으로 공급할 예정이다. 이제품에 장착된 1.6ns의 삼성 GDDR3 메모리가 현재 시장에서 볼 수 있는 유일한 GDDR3 메모리이며, ATI의 X800도 동일 모델의 메모리를 장착할 예정이다.

삼성 1.6ns GDDR-3 메모리

카드의 뒷면에는 SAMSUNG 600MHz라 써진 라벨을 발견할 수 있는데, 이는 메모리의 동작 클럭을 알 수 있게 해주는 것이다. 그렇지만 이번 샘플의 동작 클럭은 1100MHz(DDR) 이어서 실제 제품에서 몇 클럭으로 동작하게 될지 궁금해진다.

GeForce 6800 Ultra가 이전 제품군과 기능적으로 달라진 부분 중 가장 크게 달라진 부분이 바로 Quadro에 장착되었었던 듀얼 DVI-I의 듀얼 링크 기능과 하드웨어 인코더가 내장되었다는 것이다. 아래 사진으로 보기에는 이 제품이 단순히 듀얼 DVI-I 만을 구현하는 것 같다. 또한 비디어 단자도 위쪽으로 이동했다.

듀얼 DVI + VIVO 출력부

듀얼 링크 기능은 두 개의 DVI-I 출력부를 링크시켜 하나의 대형 디스플레이를 출력해주는

Page 22: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

기술로 이미 웍스테이션 제품군인 Quadro의 하이엔드 제품에 채용되었던 기능이다. 듀얼 링크 기능을 이용할 경우 QUXGA가 지원되어, 그 활용 범위를 넓힐 수 있게 된다.

VIVO 칩셋 및 TMDS 1st 칩셋

아래 보이는 Silicon Image의 Sil178CT64 칩이 듀얼 링크를 위한 TMDS 칩셋으로, 단독으로 사용될 경우 최대 1600x1200 해상도의 DVI 출력하기 때문에 현재 NVIDIA 제품군에 널리 쓰이고 있는 Sil164CT64 칩과 스펙상 큰 차이가 없다. 하지만 Sil178CT64 칩은 듀얼 링크가 가능한 칩셋으로, GeForce 6800 Ultra가 당장 듀얼 링크를 지원하지 못한다 하더라도, 설계 당시부터 듀얼 링크를 염두해두었음을 알 수 있는 부분이다.

카드 뒷면의 2nd TMDS 칩셋

l Sil178 Data Sheet - Silicon Image

GeForce 6800 Ultra는 듀얼 외부 전원부를 갖추고 있다. 일부 사이트의 리포트에 의하면 이 제품이 약 100W가 넘는 전력을 소모하는 것으로 알려져 있다. NVIDIA 역시 480W 이상의 메인 파워 서플라이 사용을 권장하고 있다.

Page 23: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

외부 듀얼 전원부

제품의 올바른 동작을 위해서는 두 개의 커넥터에 두 개의 파워커넥터를 연결해야 한다. 이전 제품의 경우 파워 단자를 연결하지 않아도 3D 어플리케이션을 제외한 프로그램의 동작이 가능했다. GeForce 6800 Ultra는 외부 전원을 연결하지 않을 경우 커넥터 옆에 달려있는 스피커에서 비프음이 나고 부팅이 되지 않는다.

전원부는 이전에 비해 훨씬 심플해졌지만, 발열이 상상을 초월한다. 대부분의 캐패시터들이 SMD 타입으로 부착되어 있고, 발열의 해소를 위해 작은 방열판이 붙어있다. 실제로 만져보면 이부분에서 가장많은 열이 난다.

간단해보이는 전원부

쿨링 솔루션 역시 이전에 비해 훨씬 심플하고 최적화된 모습을 보이고 있다. 이전까지는 GPU와 메모리 모두 열이 심하기 때문에 밀도높은 금속을 통한 하드코어적인 쿨링 시스템이 필요하였지만, GeForce 6800 대에 이르러서는 상황이 달라졌다. GDDR3 메모리가 비교적 저발열이기 때문에, GPU만을 집중적으로 쿨링하면 되기 때문이다. 따라서 아래 쿨링 시스템에 보이는 메모리 힛싱크 부분의 힛트파이프는 멋지게 보이기 위한 오바일 가능성도 높다.

Page 24: 지난 13일 GeForce 6800 Series를 전세계적으로 출시했던 에게 지난 … · 능향상으로 수많은 복소수 계산과 픽셀 연산이 가능해졌다. 따라서

50mm 블로우 팬

코어 및 메모리 힛싱크