33
АЛ-31 для СУ-27 Двигатель для «Сухой «Суперджет» 15 лет 6 лет 50 опытных образцов 8 тестовых образцов 3.5 млрд долларов 600 млн евро

Hpc 2.26.03.2013

  • Upload
    -

  • View
    80

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Hpc 2.26.03.2013

АЛ-31 для СУ-27 Двигатель для «Сухой «Суперджет»

15 лет 6 лет

50 опытных образцов 8 тестовых образцов

3.5 млрд долларов 600 млн евро

Page 2: Hpc 2.26.03.2013

Большинство суперкомпьютеров (список top500.org) – гетерогенные среды.

CPU : GPU = 1 : n (n = 1, 2, 3,…)

Page 3: Hpc 2.26.03.2013

Cray Titan29 октября 2012

18 688 AMD Opteron (16 ядер в каждом)18688 Tesla K20X9 МВт, 404 кв. м

20 петафлопс (1015) – 1 место

Page 4: Hpc 2.26.03.2013

Архитектура GPU. Технологии GPGPU.

Кизько Б. А., 5085/2, ИИТ, ФГБОУ ВПО СПбГПУ

26.03.2013

Page 5: Hpc 2.26.03.2013

GPUПостроение в реальном времени изображений по

описанию трехмерных сцен

Page 6: Hpc 2.26.03.2013

GPU

Быстрая однородная обработка большого количества элементовАппаратная реализация основных алгоритмов

Графический процессор изначально создавался как многоядерная структура (сотни ядер).

Page 7: Hpc 2.26.03.2013

GPU

CPU vs GPUГораздо больше транзисторов GPU

отведено на обработку данных, а не на управление исполнением

(т.н. Flow control)

Page 8: Hpc 2.26.03.2013

GPU

Cg, GLSL, HLSL

Page 9: Hpc 2.26.03.2013

GPU

General-Purpose Computing on Graphics Processing Unit

Page 10: Hpc 2.26.03.2013

NVIDIA Compute Unified Device Architecture

Intel Core i5 – 110 Гфлопс – 100 ВтCore 2 Duo – 19 Гфлопс - 90 Вт

Tesla K20X – 3,95 Тфлопс – 225 ВтRadeon HD 7660G – 380 Гфлопс - 35 Вт

Page 11: Hpc 2.26.03.2013
Page 12: Hpc 2.26.03.2013

GPGPU до 2007 года

Шейдерные языки Cg, GLSL и HLSLGLSL – OpenGLHLSL – Microsoft DirectX

1. Широкая поддержка оборудования.2. Отсутствие готовых библиотек.3. Необходимо знание специализированного

языка4. Привязка к графическим API.

Page 13: Hpc 2.26.03.2013

GPGPU до 2007 года

5. Отсутствует возможность взаимодействия между пикселями.6. Отсутствуют операции типа scatter – есть только gather.

Page 14: Hpc 2.26.03.2013

GPGPU до 2007 года

7. Приложения часто ограничены ПСП.

Простой вычислительных мощностей!

Page 15: Hpc 2.26.03.2013

NVIDIA Compute Unified Device Architecture

ноябрь 2006 г. - первый GPU с DirectX 10, GeForce 8800 GTX с архитектурой CUDA

• Учёт требований IEEE к арифметическим операциям

• Набор команд, ориентированный на вычисления. Независимость от графических API

• Произвольный доступ к памяти для чтения и записи

• CUDA Toolkit и CUDA SDK

Page 16: Hpc 2.26.03.2013

NVIDIA CUDA

Есть байт-адресация

Gather

Scatter

Page 17: Hpc 2.26.03.2013

NVIDIA CUDA

Доступ к регистровой разделяемой памяти для обмена данными между потоками

Page 18: Hpc 2.26.03.2013

NVIDIA Compute Unified Device Architecture

Язык программирования C с расширениямиРаспространённость GPU

GeForce 8, 9, 100, 200, 300, 400, 500, 600, 700

Page 19: Hpc 2.26.03.2013

NVIDIA Compute Unified Device Architecture

GPU – сопроцессор (device) для CPU (host)Собственная память (память устройства, device memory)Параллельная обработка множества потоков

Ядро (kernel) – исполняемая над большим числом потоков функция с параллелизмом данных

Отличия потоков GPU от CPU:•Для полной эффективности GPU нужны тысячи потоков•Легковесность, низкие накладные расходы на создание

Page 20: Hpc 2.26.03.2013

NVIDIA Compute Unified Device Architecture

Page 21: Hpc 2.26.03.2013

NVIDIA Compute Unified Device Architecture

SIMD (Single Instruction – Multiple Data)SIMT (Single Instruction – Multiple Thread)

Несколько видов памяти (регистры, локальная,

разделяемая, глобальная, константная, текстурная) с разными правами доступа

Page 22: Hpc 2.26.03.2013

NVIDIA Compute Unified Device Architecture

Page 23: Hpc 2.26.03.2013

Open Compute Language

Khronos Group: AMD, Intel, Motorola, Apple, NVIDIA, IBM, ARM

2008 г. - OpenCL 1.01 декабря 2012 г. - OpenCL 1.2

C99 с новыми ключевыми словами

Открытый стандарт

Широкая поддержка оборудования

Прирост в WinZip 16.5 на AMD APU - 45%

Page 24: Hpc 2.26.03.2013

Open Compute Language

CPU (host) управляет OpenCL-устройствами (devices): CPU, GPU, DSP, …

Page 25: Hpc 2.26.03.2013

Open Compute Language

WinZip, ArcSoft, Corel VideoStudio, GIMP, Mathematica 8, vReveal, Blender, BattleField 3, …

PyOpenCL, WebCL (JS-интерфейс для обработки вычислений в браузере, поддержка в Firefox и WebKit), ScalaCL, Ruby-OpenCL

PGI OpenCL Compiler, OpenCL Studio, ZiiLABD OpenCL SDK

http://openclnews.com/apps

Page 26: Hpc 2.26.03.2013

Open Compute Language

AMD OpenCL University Kit

Набор материалов от AMD для обучения технологии в течение семестра. 13 лекций с примерами кода и набором заданий

http://developer.amd.com/resources/heterogeneous-computing/opencl-zone/

Page 27: Hpc 2.26.03.2013

HSA Foundation

AMD, ARM, Samsung, Texas Instruments, Qualcomm, MediaTek, Imagination Technologies

Page 28: Hpc 2.26.03.2013

Intel

Larrabee -> Xeon Phi

Архитектура x86Много ядер Pentium в одном чипе с общей памятью

Page 29: Hpc 2.26.03.2013

Intel Xeon Phi

Сопроцессор 5110P:

60 ядер Pentium 1GHz с EM64T, 4 потока/ядро 512-бит SIMD512К L21 TFLOPS6/8 Gb GDDR5RHEL 6.xSuSE Linux 12

Page 30: Hpc 2.26.03.2013

Intel Xeon Phi

Page 31: Hpc 2.26.03.2013

Взаимодействие NVIDIA с ВУЗами

269 университетов мираСПбГПУ, СПбГУ, "Дубна", ОИЯИ, МИЭТ, МГТУ им. Баумана, МАИ,

"Курчатовский институт", МГУ им. Ломоносова, ...

декабрь 2009 - научно-образовательный центр "Параллельные вычисления", Дубна

Page 32: Hpc 2.26.03.2013

Список источников1. Сайты HSA Foundation, NVIDIA, AMD, Khronos Group2. thg.ru - подробный обзор Intel Xeon Phi3. Wikipedia4. Статьи с habrahabr.ru5. Сайт научно-образовательного центра "Параллельные вычисления" http://www.parallel-compute.ru/6. opencl.org7. gpgpu.org8. Результаты НИР на 3-4 курсах. Научный руководитель - Семьянов П. В.

Page 33: Hpc 2.26.03.2013

Благодарю за внимание!