41
Polska Infrastruktura Polska Infrastruktura Informatycznego Wspomagania Nauki Informatycznego Wspomagania Nauki w Europejskiej Przestrzeni Badawczej w Europejskiej Przestrzeni Badawczej Polska infrastruktura Polska infrastruktura informatycznego wspomagania informatycznego wspomagania nauki w europejskiej nauki w europejskiej przestrzeni badawczej – PL-Grid przestrzeni badawczej – PL-Grid Mariusz Sterzel Mariusz Sterzel ACK Cyfronet AGH ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl m.sterzel/^at^\cyfronet.pl Wydział Chemii UJ Kraków, 26 luty 2010

Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

  • Upload
    zander

  • View
    39

  • Download
    0

Embed Size (px)

DESCRIPTION

Polska infrastruktura informatycznego wspomagania nauki w europejskiej przestrzeni badawczej – PL-Grid. Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl. Wydział Chemii UJ Kraków, 26 luty 2010. Plan prezentacji. Co to jest/nie jest grid? Enabling Grids for E-scienceE - PowerPoint PPT Presentation

Citation preview

Page 1: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Polska Infrastruktura Polska Infrastruktura Informatycznego Wspomagania Nauki Informatycznego Wspomagania Nauki w Europejskiej Przestrzeni Badawczejw Europejskiej Przestrzeni Badawczej

Polska infrastruktura Polska infrastruktura informatycznego wspomagania informatycznego wspomagania

nauki w europejskiej przestrzeni nauki w europejskiej przestrzeni badawczej – PL-Gridbadawczej – PL-Grid

Mariusz SterzelMariusz Sterzel

ACK Cyfronet AGHACK Cyfronet AGH

m.sterzel/^at^\cyfronet.plm.sterzel/^at^\cyfronet.pl

Wydział Chemii UJ

Kraków, 26 luty 2010

Page 2: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Plan prezentacjiPlan prezentacji

Co to jest/nie jest grid? Enabling Grids for E-scienceE Europejska Inicjatywa Gridowa (EGI) Czym jest projekt PL-Grid

idea i struktura PL-Grid dostępne i planowane zasoby

Wykorzystanie gridu w Cyfronecie dostępne oprogramowanie rozwijane projekty

Jak zostać użytkownikiem Sposób pozyskania zasobów Wirtualne Laboratorium

2

Page 3: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Czym jest/nie jest grid?Czym jest/nie jest grid?

Grid nie jest: nową generacją internetu nowym systemem operacyjnym tylko:

• sposobem na wykorzystanie wolnych mocy obliczeniowych

• nowym modelem obliczeń równoległych

• nowym typem sieci P2P

3

Page 4: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Czym jest/nie jest grid?Czym jest/nie jest grid?

Definicja – Vaidy Sunderam

infrastruktura umożliwiająca współdzielenie, wybór czy gromadzenie geograficznie rozproszonych zasobów (komputerów, oprogramowania, {baz} danych czy ludzi)

czyli uwspólnionymi (wirtualnie) zasobami zależnymi od ich dostępności, pojemności czy kosztów przeznaczonymi do rozwiązywania skomplikowanych

problemów zgrupowanymi w ramach wirtualnych organizacji

4

Page 5: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Wg Iana Fostera grid toWg Iana Fostera grid to

infrastruktura pozwalająca na współpracę i uwspólnianie zasobów dla aplikacji naukowych

serwis wykorzystujący otwarte standardy ogólne protokoły i interfejsy

zintegrowane zarządzanie rozproszonych serwisów

i technologii ‘niespokojna’ technologia umożliwiająca wirtualne

i kolektywne tworzenie rozproszonego świata społeczność i technologia Open Source slogan marketingowy wszystkie powyższe razem... ;-)

5

Page 6: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

EGEEEGEE

6Mariusz Sterzel CGW'08 Kraków, 13 October 2008 6

EGEE

ArcheologyAstronomyAstrophysicsCivil ProtectionComp. ChemistryEarth SciencesFinanceFusionGeophysicsHigh Energy PhysicsLife SciencesMultimediaMaterial Sciences…

>250 sites48 countries>150,000 CPUs>50 PetaBytes>15,000 users>150 VOs>150,000 jobs/day

Page 7: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

EGEE – wykorzystanie zasobówEGEE – wykorzystanie zasobów

7

Page 8: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Gridowe zasoby EGEE w rejonie CEGridowe zasoby EGEE w rejonie CE

8

Page 9: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

LHC GridLHC Grid Budowa środowiska obliczeniowego dla eksperymentów LHC Obszary rozwoju

Budowa infrastruktury złożonej z klastrów komputerów PC Rozwój oprogramowania Gridu zwanego middleware (gLite Budowa systemów zarządzania i pomocy dla użytkowników

Projekt przyjęty przez CERN Council we wrześniu 2001 2001-2007: Instalacja systemu i doprowadzenie do działania

2005: Rozszerzenie do systemu światowego WLCG opartego o sieci Grid: EGEE, OSG, NorduGrid

2007: odbiór wstępnej fazy serwisu

2008/2009: produkcja symulacji dla eksperymentów oraztesty przed pierwszym uruchomieniem akceleratora LHC

Jesień 2009: powtórny start LHC i pierwsze dane

9

Page 10: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Europejska Inicjatywa GridowaEuropejska Inicjatywa Gridowa

A zaczęło się tak:

“…for Grids we would like to see the move towards

long-term sustainable initiatives less dependent upon

EU-funded project cycles”

Viviane Reding, Commissioner, European Commission,EGEE’06 Conference,

September 25, 2006

10

Page 11: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

EGIEGI

Cel: Utworzenie trwałej e-infrastruktury gridowej w Europie Bazującej na Narodowych Inicjatywach Gridowych (NGI)

Każda NGI powinna: reprezentować wszystkie zainteresowane strony w danym

kraju zmobilizować się i uzyskać fundusze na działanie ze

środków własnych danego kraju zbudować i zarządzać narodową e-infrastrukturą gridową wspierać społeczności naukowe brać udział w działaniach międzynarodowych, wnosić wkład

i jednocześnie wdrażać międzynarodowe standardy

11

Page 12: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Kraje zrzeszone w EGIKraje zrzeszone w EGI

12

Page 13: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Idea PL-GridIdea PL-Grid Otwarta ogólnopolska infrastruktura gridowa wspierająca

uprawianie nauki w sposób umożliwiający integrację danych doświadczalnych i wyników zaawansowanych symulacji komputerowych badania mogą być prowadzone przez geograficznie rozproszone

zespoły Dostarczanie polskiej społeczności naukowej usług

informatycznych opartych na gridowych klastrach komputerowych, służących e-Nauce w różnych dziedzinach infrastruktura musi być kompatybilna i interoperabilna z gridem

europejskim i światowym System skalowalny, pozwalający na dołączenie lokalnych

klastrów komputerowych uczelni, instytutów badawczych czy „platform technologicznych” może być wykorzystany przez administrację państwową, zespoły

zarządzania kryzysowego czy jednostki przemysłowe

13

Page 14: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Skład konsorcjumSkład konsorcjum Akademickie Centrum Komputerowe CYFRONET AGH – koordynator Poznańskie Centrum Superkomputerowo-Sieciowe (PCSS) Wrocławskie Centrum Sieciowo – Superkomputerowe (WCSS) Centrum Informatyczne Trójmiejskiej Akademickiej Sieci

Komputerowej (TASK) Interdyscyplinarne Centrum Modelowania Matematycznego i

Komputerowego (ICM)

14

Page 15: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

PL-GridPL-Grid

Infrastruktura dostępna nieodpłatnie dla wszystkich związanych z nauką polską

Możliwe jest korzystanie zarówno z zasobów lokalnych danych klastrów jak i infrastruktury gridowej

Dostęp do infrastruktury mogą uzyskać zarówno pracownicy naukowi, studenci jak i osoby współpracujące z instytucjami naukowymi

15

Page 16: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Oferta PL-GridOferta PL-Grid

Docelowy wzrost udostępnianej mocy obliczeniowej do ok. 215 TFLOPs (5000 procesorów 4-rdzeniowych) oraz pamięci dyskowej o ok. 2500 TB

Zestaw zaawansowanych narzędzi do organizacji eksperymentów obliczeniowych, który pomożemy dostosować do indywidualnych potrzeb

Pomoc w zrozumieniu zagadnień związanych z uruchamianiem aplikacji naukowych na rozległych zasobach obliczeniowych

Wsparcie technologiczne i informatyczne przy projektowaniu własnych aplikacji naukowych i ich wdrażaniu na infrastrukturze PL-Grid

16

Page 17: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Obecne zasobyObecne zasoby

Ponad 5000 rdzeni... Ponad 300 TB pamięci dyskowych... Możliwość integracji zasobów, aplikacji itp. w ramach

Wirtualnego Laboratorium PL-Grid Szkolenia dla początkujących i zaawansowanych

użytkowników platformy PL-Grid

17

Page 18: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Jaka aplikacja może być przystosowana do użytkowania w PL-Grid?

Każda!

(niektóre po lekkich modyfikacjach)

Programy sekwencyjne – bez zmian Aplikacje równoległe (MPI) – bez zmian Programy interaktywne – wymagana zmiana w komunikacji

z użytkownikiem Operacje na wielkich zbiorach danych – zmiana dostępu do

danych

Możliwość jednoczesnego uruchamiania kilkudziesięciu/kilkuset i więcej instancji danego programu

18

OprogramowanieOprogramowanie

Page 19: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Wyznaczanie struktury elektronowejWyznaczanie struktury elektronowej

Programy do szerokiego spektrum obliczeń kwantowochemicznych:

Gaussian

• prosty w obsłudze, stosowany powszechnie

• zaimplementowana wielość funkcji Turbomole

• bardzo dobrze zaimplementowane metody symulacji rozpuszczalnika

• szybkie metody do opisu stanów wzbudzonych

• możliwość przeprowadzania łączonych obliczeń QM/MM (zastosowanie m.in. QPOT)

19

Page 20: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Programy do szerokiego spektrum obliczeń kwantowochemicznych:

ADF szybki (z racji obliczeń w bazach slaterowskich) szeroko stosowany w przypadku metali przejściowych obliczenia własności magnetycznych

Molcas bardzo dobra implementacja metod CASSCF oraz CASPT2: opis kompleksów metali przejściowych opis przejść pomiędzy różnymi stanami elektronowymi w czasie reakcji chemicznych

Programy Programy QM, cd.QM, cd.

20

Page 21: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Dokowanie i Dynamika MolekularnaDokowanie i Dynamika Molekularna

AutoDock program wykorzystywany do przewidywania miejsc dokowania

się lignadów do białek

NAMD program do przeprowadzania symulacji MM/MD dużych oraz bardzo

dużych systemów biologicznych przeznaczony szczególnie do obliczeń równoległych na

klastrach/gridach

21

Page 22: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Programy wykorzystywane w fizyceProgramy wykorzystywane w fizyce

ROOT Zaawansowany pakiet wykorzystywany do analizy wielkiej

ilości danych doświadczalnych

22

Page 23: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Programy wykorzystywane w fizyceProgramy wykorzystywane w fizyce

GEANT Narzędzie do modelowania przechodzenia cząstek przez

materię. Wykorzystywany jest przez fizyków wysokich energii jak również w badaniach kosmosu a nawet medycynie

23

Page 24: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Oprogramowanie...Oprogramowanie...

Kompilatory Intel Portland

Biblioteki numeryczne MKL ACML GotoBLAS

Obliczenia równoległe MPICH OpenMPI Intel MPI

24

Page 25: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Wasze programyWasze programy

Grid umożliwia wydajną pracę praktycznie wszystkich aplikacji UNIXowych programów komercyjnych i darmowych programów autorskich napisanych w ogólnodostępnych

językach programowania tj. C/C++, FORTRAN, Python, Ruby etc.

Czekamy na propozycje potrzebnych Wam programów!

25

Page 26: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

PL-GridPL-Grid

Nasi użytkownicy

26

Page 27: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Projekt nEDMProjekt nEDM

Projekt mający na celu bardzo dokładne pomiary momentu dipolowego neutronu o rozdzielczości kilku 10-28 ecm

Ponad 12 partnerów Strategia: „ultra-zimne” neutrony przechowywane

w próżni w temperaturze pokojowej Obecnie realizacja fazy I i II projektu − test

komponentów i budowa aparatu pomiarowego Organizacja wirtualna nEDM umożliwia współpracę

i  wymianę danych pomiędzy partnerami Wymagane zasoby dyskowe − ok. 20 TB

27

Page 28: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Zaawansowane obliczeniaZaawansowane obliczenia

Pakiet Cadence Wykorzystywany do

modelowania układów scalonych

Badania micromagnetyczne

nanostruktur kobaltu

28

Page 29: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Jak zostać użytkownikiemJak zostać użytkownikiem

Każda osoba związana z polską nauką może korzystać z zasobów PL-Grid

Aby zostać użytkownikiem należy zarejestrować się oraz uzyskać odpowiedni certyfikat

Procedura rejestracji oraz dalsze informacje dostępne są na stronie: http://www.plgrid.pl

Z chęcią odpowiemy na pytania: helpdesk/^at^\plgrid.pl

29

Page 30: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

www.plgrid.plwww.plgrid.pl

30

Page 31: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

RejestracjaRejestracja

31

Page 32: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Rejestracja cd.Rejestracja cd.

32

Page 33: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Rejestracja cd.Rejestracja cd.

W razie braku jakichś danych użytkownik będzie poproszony o ich weryfikację: Zwykle baza „Ludzie Nauki” w OPI nie zawiera adresu e-

mail. Procedura uaktualnienia bazy OPI przez użytkownika zajmuje kilka dni

Gdy wszystkie dane są kompletne użytkownik otrzymuje e-mailem dane logowania, linki do

dokumentacji itd. hasło – e-mailem lub w SMS

Cała procedura zajmuje zwykle ok. tygodnia

33

Page 34: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Granty obliczenioweGranty obliczeniowe

Cel: dostarczanie informacji o aktualnym wykorzystaniu zasobów

przez grupy naukowe

• CPU

• zasoby dyskowe gwarantowane zasoby obliczeniowe dla grup badawczych nagradzanie najbardziej aktywnych (naukowo) użytkowników

Przyznawane zwykle na okres 1 roku uwzględniają zarówno obliczenia gridowe jak i lokalne

Odnowienie grantu możliwe jedynie w przypadku rozliczenia poprzedniego

34

Page 35: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

BazaarBazaar

Narzędzie do dynamicznego występowania o zasoby obliczeniowe i ich przydzielania zintegrowane z systemem przydziału grantów i rozliczania

35

Page 36: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

36

Page 37: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Wirtualne Laboratorium GridSpaceWirtualne Laboratorium GridSpace Wirtualne laboratorium GridSpace umożliwia łączenie

rozproszonych zasobów obliczeniowych oraz źródeł danych. Dostarcza użytkownikom wygodnych, wysokopoziomowych

narzędzi do planowania i wykonywania eksperymentów in-silico.

37

Twórcaeksperymentu

Naukowiec Użytkownikkońcowy

ExperimentPlanningEnvironment

Scenariuszeksperymentu Portal

Komponenty wykonawcze wirtualnego laboratoriumOdpowiedzialne za dostęp do usług i uruchamianie eksperymentów

Usługi obliczenioweSerwisy, komponenty, zadania gridowe

Źródła danychSfederowane, niezależne

Grid, klastry, serwery, sieć

Użytkownicy

Interfejsy

Silnik

Usługi

Infrastruktura

Interfejsy dedykowanedla aplikacji

Page 38: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Zastosowania wirtualnego laboratoriumZastosowania wirtualnego laboratorium Przetwarzanie dużych ilości

danych Łączenie wielu programów,

narzędzi i usług do pobierania, przetwarzania danych oraz obliczeń – dostępne poprzez jednolity interfejs

Uruchamianie aplikacji w różnych technologiach (lokalne, zdalne, klastry, grid, komponenty, serwisy)

Planowanie eksperymentów; projektowanie, tworzenie i modyfikowanie ich przebiegu na podstawie wyników

Łatwe testowanie zmian i rozmaitych algorytmów

Zarządzanie rezultatami Tworzenie interfejsów WWW

38

Page 39: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Przykład eksperymentu Przykład eksperymentu - ViroLab- ViroLab

Dane wejściowe z laboratorium badanie pacjenta sekwencje genetyczne

wirusa HIV umieszczone w bazie danych

Eksperyment in-silico w wirtualnym laboratorium sekwencje nukleotydowe

wirusa HIV pobrane z bazy danych

dopasowanie sekwencji i/lub określenie ich typu za pomocą właściwych algorytmów

oporność wirusa jest wyznaczana poprzez wywołanie usługi obliczeniowej (DRS)

39

http://virolab.cyfronet.plhttp://www.virolab.org

Page 40: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Przykład eksperymentu – zwijanie białkaPrzykład eksperymentu – zwijanie białka Cel:

demonstracja zastosowania wirtualnego laboratorium dla aplikacji bioinfromatycznych

Wejście: identyfikator białka i łańcucha (PDB) Rezultat: struktura 3D Wykorzystane usługi:

Serwis Protein Data Bank (PDB) Fałdowanie metodą Early-Stage Zapisanie rezultatów na serwerze WebDav

celem zapewnienia dostępu przez WWW Powtarzanie w pętli dla wielu białek

40

http://virolab.cyfronet.pl/trac/exampleExperiments/wiki/exex/Folding

Page 41: Mariusz Sterzel ACK Cyfronet AGH m.sterzel/^at^\cyfronet.pl

Dziękuję za uwagęDziękuję za uwagę

41