Hpc 1.24.02.2013

АЛ-31 для СУ-27 Двигатель для «Сухой «Суперджет»

15 лет 6 лет

50 опытных образцов 8 тестовых образцов

3.5 млрд долларов 600 млн евро

Лишь 5% продукции производится без моделирования

"Суперкомпьютерные технологии в современном мире стали стратегической областью, без которой невозможно дальнейшее развитие. Мощность национальных суперкомпьютеров сейчас так же важна, как мощность электростанций или количество боеголовок."

Современное состояние отрасли высокопроизводительных

вычислений

Кизько Б. А., 5085/2, ИИТ, ФГБОУ ВПО СПбГПУ

2013

High-performance computing (HPC)

top500.org

1978 г. - Intel 8086 4.77 Мгц

2004 г. - Intel Pentium 4 3.46 GHz

2005 г. - Intel Pentium 4 3.8 GHz

2005 г. - 2 вычислительных ядра: AMD Athlon 64 X2, IBM PowerPC 970 и Intel Pentium D

Центральные процессоры (CPU)

2005 г. - 2 вычислительных ядра

2007 г. - 4 ядра CPU

2010 г. - 6 ядер (12 ядер для серверов)

2011 г. - 8 ядер (16 ядер)

"Мультиядерная эволюция"

1994 г. - MPI 1 (Интерфейс передачи сообщений)

1997 г. – OpenMP

2010г. – DirectCompute (DirectX 10)2011 г. - C++11 AMP (MS VS 2012)

C#, Java. 2 вида многозадачности.

Как использовать многоядерность?

N - кол-во процессоров (ядер)

"Если мы можем распараллелить 3/4 всей программы, то максимальный выигрыш составит 4 раза."

Закон Амдала ( Amdahl Law)

1

(1+P) + N

PS =

GPUCg, GLSL, HLSL

GPUGeneral-Purpose Computing on Graphics Processing Unit

NVIDIA Compute Unified Device Architecture

ноябрь 2006 г. - первый GPU с DirectX 10, GeForce 8800 GTX с архитектурой CUDA

• Учёт требований IEEE к арифметическим операциям

• Набор команд, ориентированный на вычисления

• Произвольный доступ к памяти для чтения и записи

• CUDA Toolkit и CUDA SDK


NVIDIA Tesla

Intel Core i5 – 110 Гфлопс – 100 ВтCore 2 Duo – 19 Гфлопс - 90 Вт

Tesla K20X – 3,95 Тфлопс – 225 Вт

Cray Titan29 октября 2012

18 688 AMD Opteron (16 ядер в каждом)18688 Tesla K20X9 МВт, 404 кв. м

20 петафлопс (1015) – 1 место


Язык программирования C с расширениямиРаспространённость GPU

GeForce 8, 9, 100, 200, 300, 400, 500, 600

NVIDIA CUDA. Применение

Прирост производительности CPU CPU

2 операций MD5: 100 Tesla = 10000 CPU - 2 дня

SHA-1: Phenom II X4 3.4 GHz vs GF GTX 560 Ti (49152 потока) - 10 раз

Core2 Duo 2.26 GHz vs GF 9300M (8192 потока) - 3 раза

50


Медицицина. TechniScan Svara - УЗИ35 Гб данных за 15 минут2 Tesla C1060 - 20 минут

Гидродинамика. Кэмбридж

Моделирование ПАВ. P&G2 Tesla = Cray XT3 (128 CPU) или IBM BlueGene/L

(1024 CPU)

Геология, финансы, криптография...


Наличие оптимизированных версий библиотек FFT и BLAS, SPARSE, RAND, NPP...

Поддержка готовым ПО (MAGMA, Video Encoder, Adobe Photoshop, Folding@Home, Seti@Home, CoreAVC, Cyberlink Power Director, ...

Open Compute Language

Khronos Group: AMD, Intel, Motorola, Apple, NVIDIA, IBM, ARM

2008 г. - OpenCL 1.01 декабря 2012 г. - OpenCL 1.2

C99 с новыми ключевыми словами

Открытый стандарт

Широкая поддержка оборудования

Прирост в WinZip 16.5 на AMD APU - 45%

HSA Foundation

AMD, ARM, Samsung, Texas Instruments, Qualcomm, MediaTek, Imagination Technologies

Intel

Larrabee -> Xeon Phi

Архитектура x86Много ядер Pentium в одном чипе с общей памятью

Взаимодействие NVIDIA с ВУЗами

269 университетов мираСПбГПУ, СПбГУ, "Дубна", ОИЯИ, МИЭТ, МГТУ им. Баумана, МАИ,

"Курчатовский институт", МГУ им. Ломоносова, ...

декабрь 2009 - научно-образовательный центр "Параллельные вычисления", Дубна

Список источников1. Сайты HSA Foundation, NVIDIA, AMD, Khronos Group2. thg.ru - подробный обзор Intel Xeon Phi3. Wikipedia4. Статьи с habrahabr.ru5. Сайт научно-образовательного центра "Параллельные вычисления" http://www.parallel-compute.ru/6. opencl.org7. gpgpu.org8. Результаты НИР на 3-4 курсах. Научный руководитель - Семьянов П. В.

Благодарю за внимание!

Documents

Hpc 1.24.02.2013