39
Universidad Nacional, Bogotá, Enero 2013 Computación científica 1 Perspectivas de la Computación Científica. Clusters, Grids y Clouds. Desarrollos y retos Raúl Ramos Pollán Universidad Nacional de Colombia

Perspectivas de la Computación Científica . Clusters , Grids y Clouds . Desarrollos y retos

Embed Size (px)

DESCRIPTION

Perspectivas de la Computación Científica . Clusters , Grids y Clouds . Desarrollos y retos. Raúl Ramos Pollán Universidad Nacional de Colombia. - PowerPoint PPT Presentation

Citation preview

Page 1: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

1

Perspectivas de la Computación Científica. Clusters, Grids y Clouds. Desarrollos y retosRaúl Ramos PollánUniversidad Nacional de Colombia

Page 2: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

2

Computación Científica

“La Ciencia e Ingeniería Basada en la Simulación ha alcanzado hoy día un nivel de capacidad predictiva que complementa sólidamente los pilares tradicionales de teoría, experimentación y observación … Muchas tecnologías críticas … están en un horizonte que no pueden ser entendidas, desarrolladas o usadas sin simulación por computador”.

http://www.wtec.org/sbes/

Page 3: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

3

Computación Científica

Algoritmos/Aplicaciones

Infraestructura de cómputo

Recurso humano/ Comunidades científicas

Datos

Page 4: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

4

Aplicaciones – Fine grained parallelism

Descomposición en elementos finitos

Predicción climáticaDocking de proteínas

Page 5: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

5

Aplicaciones – Coarse grained parallelism

Simulación Montecarlo

Particiones de datos

Data scans / aggregations / summaries

Summatory query form over data

Logs processing, index generation Map/reduce, Hadoop

Page 6: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

6

AplicacionesCoarse computation for fine grained parallelismBarridos de parámetros(ejemplo Stellerator TJ-II en la Grid)

Simulate deviceconf 1

Simulate deviceconf 2

Simulate device

….

Simulate deviceconf n

Generate configurations

Evaluate configurations

Page 7: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

7

Paralelización de algoritmos

• Naturaleza de los algoritmos

Page 8: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

8

Paralelización de algoritmos

• Recurso computacional disponible (GPUs, Cluster, Grids, Clouds, …)

• Topología interconexión unidades de cómputo• Estrategias para explotar recursos computacionales

Por paralelización intrínseca del algoritmoPor barrido de parámetrosPor partición de datos

Page 9: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

9

Ejemplos de algoritmosProcesamiento de imágenes operaciones en regiones (i.e. contraste)

and perform n iterations

Page 10: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

10

Ejemplos de algoritmos

Particionamiento no trivial por algoritmo(otra estrategia por datos para muchas imágenes, pero cada una tiene que caber en memoria)

xsize

ysiz

e

slot i

slot i + 1

chun

kys

ize

chunkysize + 2

chunkysize + 2

chun

kys

ize

8 chunks slot i - 1

slot i + 2

Page 11: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

11

Ejemplos de algoritmosParticionamiento no trivial

read image

split and send

interchangeboundary rows with

adjacent ranks

update image pixels

chunk 1 @ rank 1

interchangeboundary rows with

adjacent ranks

update image pixels

chunk 2 @ rank 2

interchangeboundary rows with

adjacent ranks

update image pixels

chunk 3 @ rank 3

interchangeboundary rows with

adjacent ranks

update image pixels

chunk n@ rank n

…….

receive and join

write image

rank 0

50

ite

ratio

ns

me

asu

red

pro

cess

tim

e @

ran

k 0

C1

C2C2C2

C3

Page 12: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

12

Paralelización de KMeans

Paralelizar asignación y el cálculo de la media para cada centroide

Page 13: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

13

Map-reduce, Hadoop

Page 14: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

14

Map-reduce, Hadoop

Page 15: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

15

Escalabilidad• Ley de Amdahl

N: Núm. nodos paralelos P: Proporción paralelizable del código S(N): speedup máximo

Page 16: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

16

Infraestructuras de computación

• Clusters• Supercomputadores• Clouds• Grids• GPUs• Computación oportunista

Page 17: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

17

Top500, distribución histórica (www.top500.org)

Page 18: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

18

Top500, distribución histórica (www.top500.org)

Page 19: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

19

Clusters• Planificación de tareas Batch jobs• Sistema compartido de archivos• Fast inter-networking for inter-process communication

Shared storage

Page 20: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

20

Supercomputadores• Planificación de tareas Batch jobs• Memoria compartida• Procesos multi-nodo

Page 21: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

21

Grids• Redes de datacenters• Particiones de procesos independientes• Heterogéneos• Federación vs distribución• Middleware propio

Page 22: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

22

Clouds

• Desacoplamiento infraestructura física• Modelo de cómputo no fijo: IaaS, PaaS, SaaS

Page 23: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

23

Computación oportunista

• Sobre recursos no propios• Computación voluntaria, labs de escuelas, etc.

Page 24: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

24

GPUs

• Computación matricial• Procesadores simples y masivos

Page 25: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

25

Datos científicos• Colecciones de datos

• Adquisición de datos

• Colisiones LHC, secuenciaciones, digitalizaciones, bancos de imágenes, mapas

Page 26: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

26

Datos científicos

• Orígenes• Distribución• Estándares y formatos• Propiedad y responsabilidades

Page 27: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

27

Datos científicos• Orígenes• Distribución• Estándares y formatos• Propiedad y responsabilidades

Page 28: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

28

Big Data• manejo de datasets de tamaño >> capacidad de las

herramientas tradicionales de bases de datos• según la tecnología avanza con el tiempo, el tamaño de

los conjuntos de datos a los que denomina el término también crecerán, si cabe, a un aún ritmo mayo

• Requiere nuevo modelo (no sirven BBDD tradicionales, paquetes estadísticos/visualización desktop)

• Objetivo Escalabilidad «trivial»

Page 29: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

29

Bases de datos NoSQL• Expresividad SQL vs. Escalabilidad

• Tablas: filas de keys + lista no fija de columnas/valores• Operaciones simples:

Scan por keyAcceso directo por keyTransacciones mínimas (check&put)No joins, no SQL language

• Big table, Hbase, DynamoDB, Azure, Cassandra, etc.

Page 30: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

30

Arquitectura HBase

Page 31: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

31

La GenteCientíficosIngenieros

ProgramadoresGestores de proyecto

Administrativos

Page 32: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

32

Formación multidisciplinar

Conclusión 1: El mundo de la computación es plano, cualquiera puede acceder. Lo que nos distinguirá del resto del mundo es nuestra habilidad para hacerlo mejor y explotar las nuevas arquitecturas que desarrollamos antes de que dichas arquitecturas sean universalmente usadas.

Conclusión 2: La educación y formación inadecuadas de la siguiente generación de científicos computacionales amenaza el crecimiento global de la Ciencia e Ingeniería Basadas en Simulación. Esto es particularmente urgente [...]; a no ser que preparemos a los investigadores para desarrollar y usar la próxima generación de algoritmos y arquitecturas de computadores, no seremos capaces de explotar sus capacidades para cambiar las reglas del juego.

http://www.wtec.org/sbes/

Page 33: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

33

Escenarios y Retos

Código sucio o poco estructurado

Falta de documentación

Procesos de desarrollo informal

Procesos de desarrollo informal

Arquitecturas de software y datos

espontáneas

Comunidades científicas tradicionales

Código mezclado (paralelo, seq, …)

Page 34: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

34

DecisionesCloud? Grid?

GPU?

Modificar algoritmos?

Contribuir al software?

Comprar hardware?

Adaptarse al hardware

disponible?

Duplico datasets?

Comunidad científica?

Me dedico a otra cosa?

Page 35: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

35

SOLOS NO SOMOS NADA

Mantener hardware es caro

Portar aplicaciones es caro

Criterios científicos, técnicos y organizacionales

Cambios generacionales

Page 36: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

36

A corto plazoMedir el alcance del sw/hw

disponible

Medir recurso humano disponible

Afinar objetivos y esfuerzo

Adaptar objetivos científicos a posibilidades

Page 37: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

37

A medio/largo plazoConstruir equipos multidisciplinares

Cultura HPC en la ciencia y Cultura científica en ingeniería

Iniciar procesos de planificación de software

Regeneración generacional

Actualizar programas de capacitación (BSc Msc PhD)

Generar frameworks y modelos de computación

Generar frameworks y modelos de computación

Estrategias transnacionales

Page 38: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

38

Conclusiones

• La computación científica es un reto tecnológico, científico y organizacional

• Científicos e ingenieros computacionales se necesitan mutuamente equipos multidisciplinares

• Tecnología vs. Modelos de computación vs. Disponibilidad de recursos (humanos + técnicos)

• Conciliar estrategias a corto, medio y largo plazo

EL USO DEL CÓMPUTO CIENTÍFICO ES INEVITABLE

CAMBIO DE PARADIGMA EVITAR OBSOLESCENCIA

Page 39: Perspectivas de la Computación  Científica .  Clusters ,  Grids  y  Clouds . Desarrollos y retos

Universidad Nacional, Bogotá, Enero 2013

Computación científica

39

?