Upload
-
View
89
Download
0
Embed Size (px)
Citation preview
АЛ-31 для СУ-27 Двигатель для «Сухой «Суперджет»
15 лет 6 лет
50 опытных образцов 8 тестовых образцов
3.5 млрд долларов 600 млн евро
Лишь 5% продукции производится без моделирования
"Суперкомпьютерные технологии в современном мире стали стратегической областью, без которой невозможно дальнейшее развитие. Мощность национальных суперкомпьютеров сейчас так же важна, как мощность электростанций или количество боеголовок."
Современное состояние отрасли высокопроизводительных
вычислений
Кизько Б. А., 5085/2, ИИТ, ФГБОУ ВПО СПбГПУ
2013
High-performance computing (HPC)
top500.org
1978 г. - Intel 8086 4.77 Мгц
2004 г. - Intel Pentium 4 3.46 GHz
2005 г. - Intel Pentium 4 3.8 GHz
2005 г. - 2 вычислительных ядра: AMD Athlon 64 X2, IBM PowerPC 970 и Intel Pentium D
Центральные процессоры (CPU)
2005 г. - 2 вычислительных ядра
2007 г. - 4 ядра CPU
2010 г. - 6 ядер (12 ядер для серверов)
2011 г. - 8 ядер (16 ядер)
"Мультиядерная эволюция"
1994 г. - MPI 1 (Интерфейс передачи сообщений)
1997 г. – OpenMP
2010г. – DirectCompute (DirectX 10)2011 г. - C++11 AMP (MS VS 2012)
C#, Java. 2 вида многозадачности.
Как использовать многоядерность?
N - кол-во процессоров (ядер)
"Если мы можем распараллелить 3/4 всей программы, то максимальный выигрыш составит 4 раза."
Закон Амдала ( Amdahl Law)
1
(1+P) + N
PS =
GPUCg, GLSL, HLSL
GPUGeneral-Purpose Computing on Graphics Processing Unit
NVIDIA Compute Unified Device Architecture
ноябрь 2006 г. - первый GPU с DirectX 10, GeForce 8800 GTX с архитектурой CUDA
• Учёт требований IEEE к арифметическим операциям
• Набор команд, ориентированный на вычисления
• Произвольный доступ к памяти для чтения и записи
• CUDA Toolkit и CUDA SDK
NVIDIA Compute Unified Device Architecture
NVIDIA Tesla
Intel Core i5 – 110 Гфлопс – 100 ВтCore 2 Duo – 19 Гфлопс - 90 Вт
Tesla K20X – 3,95 Тфлопс – 225 Вт
Cray Titan29 октября 2012
18 688 AMD Opteron (16 ядер в каждом)18688 Tesla K20X9 МВт, 404 кв. м
20 петафлопс (1015) – 1 место
NVIDIA Compute Unified Device Architecture
Язык программирования C с расширениямиРаспространённость GPU
GeForce 8, 9, 100, 200, 300, 400, 500, 600
NVIDIA CUDA. Применение
Прирост производительности CPU CPU
2 операций MD5: 100 Tesla = 10000 CPU - 2 дня
SHA-1: Phenom II X4 3.4 GHz vs GF GTX 560 Ti (49152 потока) - 10 раз
Core2 Duo 2.26 GHz vs GF 9300M (8192 потока) - 3 раза
50
NVIDIA CUDA. Применение
Медицицина. TechniScan Svara - УЗИ35 Гб данных за 15 минут2 Tesla C1060 - 20 минут
Гидродинамика. Кэмбридж
Моделирование ПАВ. P&G2 Tesla = Cray XT3 (128 CPU) или IBM BlueGene/L
(1024 CPU)
Геология, финансы, криптография...
NVIDIA CUDA. Применение
Наличие оптимизированных версий библиотек FFT и BLAS, SPARSE, RAND, NPP...
Поддержка готовым ПО (MAGMA, Video Encoder, Adobe Photoshop, Folding@Home, Seti@Home, CoreAVC, Cyberlink Power Director, ...
Open Compute Language
Khronos Group: AMD, Intel, Motorola, Apple, NVIDIA, IBM, ARM
2008 г. - OpenCL 1.01 декабря 2012 г. - OpenCL 1.2
C99 с новыми ключевыми словами
Открытый стандарт
Широкая поддержка оборудования
Прирост в WinZip 16.5 на AMD APU - 45%
HSA Foundation
AMD, ARM, Samsung, Texas Instruments, Qualcomm, MediaTek, Imagination Technologies
Intel
Larrabee -> Xeon Phi
Архитектура x86Много ядер Pentium в одном чипе с общей памятью
Взаимодействие NVIDIA с ВУЗами
269 университетов мираСПбГПУ, СПбГУ, "Дубна", ОИЯИ, МИЭТ, МГТУ им. Баумана, МАИ,
"Курчатовский институт", МГУ им. Ломоносова, ...
декабрь 2009 - научно-образовательный центр "Параллельные вычисления", Дубна
Список источников1. Сайты HSA Foundation, NVIDIA, AMD, Khronos Group2. thg.ru - подробный обзор Intel Xeon Phi3. Wikipedia4. Статьи с habrahabr.ru5. Сайт научно-образовательного центра "Параллельные вычисления" http://www.parallel-compute.ru/6. opencl.org7. gpgpu.org8. Результаты НИР на 3-4 курсах. Научный руководитель - Семьянов П. В.
Благодарю за внимание!