Upload
vanna-wilkinson
View
37
Download
1
Embed Size (px)
DESCRIPTION
Departamento : Informática Aplicada => Sistemas Informáticos (Bloque IV - Planta 4ª) Profesores : Pablo Carazo D4417 email : [email protected] TABLÓN DE ANUNCIOS : www.dia.eui.upm.es Normas del Curso Tutorías Notas Exámenes PRÁCTICAS : Laboratorio 4405. - PowerPoint PPT Presentation
Citation preview
proPar Presentación Curso 15/16
Departamento: Sistemas Informáticos
(Bloque IV - Planta 4ª)Profesores:
Pablo Carazo D4417 email: [email protected]
TABLÓN DE ANUNCIOS: <==> www.dia.etsisi.upm.esNormas del CursoTutoríasNotasExámenes
PRÁCTICAS: Laboratorio 4405
L y X 11-13 18-19
proPar Presentación 2
Secretaria
L y J(15’00 a 18’00)
Mi despacho
Tablón
?
“Aumento de prestaciones”
• Alta productividad • Alto rendimiento
3 en un año
Más tareas en el mismo tiempo
Un año
6 meses
Misma tarea en menos tiempo
• + gente• + ahínco• mejor
• + CPU’s• + GHz• algoritmo
proPar Presentación 3
proPar Objetivo 4
• Poner a trabajar juntos a varios procesadores (2 ... 10.000 ...)
Decenas de núcleos
RED
¿Buses?
18 Miles de núcleos
Intel AMD Oracle
8 núcleos 8 núcleos 16 núcleos
61 16
OBJETIVOS: “Ejecutar un programa más rápido”
proPar Presentación 5
• Poner a trabajar juntos a varios procesadores (2 … 10.000 …)
• Implementaciones concretas (Prácticas)
• Técnicas básicas para el desarrollo de programas paralelos
• Entornos de desarrollo (Hw + Lenguaje + Depurador + Monitor)
Prensa 19/06/12: IBM recupera elliderazgo mundial supercomputadores
1.572.864 núcleos 16,32 PetaFlops1993 CM-5/1024 3 días 1 segundo
2008 Libro electrónico:How to Survive the Multicore
Software RevolutionParalelismo en el PC Gran desafío
Intel AMD Oracle
8 núcleos 8 núcleos 16 núcleos
OBJETIVOS: “Ejecutar un programa más rápido”
proPar Presentación 6
Prensa 19/06/12: IBM recupera elliderazgo mundial supercomputadores
1.572.864 núcleos 17,17 PetaFlops1993 CM-5/1024 3 días 1 segundo
TOP500 Jun/2013: China duplicala capacidad del Titan 2 años antes
3.120.000 núcleos 33,86 PetaFlops
¿ Jun2015 ?
1
2
3
Titan (USA) con 560.640 núcleos
proPar Presentación 7Prensa 7/08/2015: Golpe en la carrera de los superodenadores
Obama impulsa la supercomputación con una máquina que permitirá hacer un trillón de cálculos por segundo y podrá
predecir con una exactitud inédita el cambio climático
x30
proPar Presentación 8
Programa de Teoría
1 Computadores Paralelos
2 Programación basada en paso de mensajes (MPI)
3 Técnicas básicas de programación paralela
Compulsiva, Divide y vencerás, Pipeline,
Síncrona, Equilibrado de carga y Terminación
4 Programación basada en memoria común (OpenMP, CUDA)
5 Algoritmos y aplicaciones
Ordenación, Numéricos, Imagen, Búsqueda
Bibliografía• Transparencias Fotocopias?? / WWW
• “Parallel Programming. .....”. B. Wilkinson & M. Allen - P.H. 1999-2005
• “Parallel Programming in C with MPI and OpenMP”. Quinn,M.J. – MGH 2003
proPar Presentación 9
Relación con otras asignaturas:
1 Computadores Paralelos
2 Programación con paso de mensajes (MPI)
3 Técnicas básicas de programación paralela
4 Programación con memoria común (OpenMP)
5 Algoritmos y aplicaciones
Ordenación, Numéricos, Imagen, Búsqueda
Arquitecturas Paralelas
Programación …
Concurrente y Sistemas
OperativosAlgorítmica y complejidad
proPar Presentación 10
• Planificación.. 23 de Sep => Agruparse en grupos de dos
.. 2 de Dic => 5 turnos de 2+2 horas
1. Toma de contacto (mediciones de tiempos)
2. Montecarlo (PI), Divide y vencerás (# veces)
3. Cálculo de números primos
4. Cálculo de fractales
5. Entorno OpenMP: PI y ordenación
• Las prácticas
• Entorno•Cluster de 9 PC’s –cada uno 4 núcleos- (Lab4405) + PC9•Lenguaje de programación “C”•MPI “Message Passing Interface”
Programa de Prácticas
¿Breviario de C?
CUDA
proPar Presentación 11
Dibujaremos este fractal en secuencial en 43 segundos y, utilizando 16 núcleos, lo
conseguiremos dibujar en tan sólo 3 segundos
proPar Presentación 12
proPar Presentación 13
Pentium Core 2 Quad Q66002,4GHz • 8ML2 • 4GB • 500GB
Red E.U.I.Switch
GigaEthernet
pc1pc2pc3pc5 pc4
pc6
pc7pc8
Core i7
proPar Presentación 14
Pentium Core 2 Quad Q82002,4GHz • 4ML2 • 2GB • 300GB
PC10 PC11
proPar Presentación 15
2 Xeon E5520 Quad2,26GHz • 8ML3 • 12GB • 500GB
PC9
proPar Presentación 16
3 * NVIDIA GEFORCE GTX 6602GB GDDR5 960 núcleos 1,03 GHz
1 * NVIDIA GEFORCE GTX 7502GB GDDR5 512 núcleos 1,14 GHz
proPar Presentación 17
34,245 seg
1,329 seg8,840 seg
MPI4 núcleos
1,809 seg
MPI32 núcleos
proPar Presentación 18
Parallella Epiphany-16 Desktop Computer16 núcleos 600MHz => 19,2 GFlops
Zynq dual core ARM-A9 1GB SDRAM
µSD
µHDMI
µUSB GigabitEthernet
proPar Presentación 19
proPar Presentación 20
proPar Presentación Planificación 21
SeptiembreL 7X 9L 14X 16L 21X 23L 28X 30
OctubreL 5X 7L 12X 14L 19X 21L 26X 28
Presentación
comParale
Teoría
pasoMsj
Prácticas
compulsiva
divideVence1. Contacto
1. Contacto
2. MonteCar
2. MonteCar
T1 y …
pipeline
NoviembreL 2X 4L 9X 11L 16X 18L 23
DiciembreL 30
X 2L 7X 9
síncrona
Teoría
pasoMsj
Prácticas
equiliTermi
T2 mComún
memComún
3. Primos
4. Fractales
5. openMP
ordenación
X 25
4. Fractales
3. Primos
L 14X 16
ordenación
5. openMP
memComún
T3 Artículos
comParale
ArtículosL 21
proPar Presentación 22
• Evaluación contínua [Adherirse* ..5Oct]Asistencia 4 puntos (Control + tests)
Trabajo 2 puntos (Exposición o Escrito)
Práctica 4 puntos (Funcionando en 1,2,4,8,16 núcleos)
• “A Common Parallel Computing Framework for Modeling Hydrological Processes of River Basins”, 2011
• “AA-Sort: A New Parallel Sorting Algorithm for Multi-core Parallel Systems”, 2007
• “Un banco de pruebas de ordenación paralela”, 2007
• “CUDA-based Real-time Face Recognition System”, 2014
• “Invasive MPI on Intel’s Single-Chip Cloud Computing”, 2012
Competencia “Análisis y síntesis”
Guía de aprendizaje
proPar Presentación 23
ActividadHoras
presencialesHoras no
presenciales Horas totales
Clases
Prácticas
Presentación artículos
Tests
Tutorías
Totales
28
20
4
3
1
56
28
40
14
12
0
94
56
60
18
15
1
150
FIN