1
APPLICAZIONE DI PRECONDIZIONATORI PARALLELI ALGEBRICI MULTILIVELLO ALLA SIMULAZIONE LES DI UN FLUSSO TURBOLENTO CONFINATO Andrea Aprovitola (1) , Pasqua D’ambra (2) , Filippo Maria Denaro (1) , Daniela di Serafino (3) , Salvatore Filippone (4) (1) ( Dipartimento di Ingegneria. Aerospaziale e Meccanica, Seconda Università degli Studi di Napoli, Via Roma 29, I-81031 Aversa [email protected] , [email protected] ) (2) ( Istituto di Calcolo e Reti ad Alte Prestazioni, CNR, Via Pietro Castellino 111, I-80131 Napoli, [email protected] ) (3) ( Dipartimento di Matematica, Seconda Università degli Studi di Napoli, Via Vivaldi 43, I-81100 Caserta, [email protected] ) (4) (Dipartimento di Ingegneria Meccanica, Università di Roma “Tor Vergata”, Viale del Politecnico 1, I-00133, Roma, [email protected] ) Obiettivo e focal points del lavoro Risoluzione efficiente di sistemi lineari sparsi provenienti dall’applicazione di metodi di proiezione alla simulazione LES di flussi turbolenti confinati su cal- colatori paralleli a memoria distribuita 1) integrazione delle librerie di software numerico PSBLAS (Parallel Sparse Basic Linear Algebra Subprograms) e MLD2P4 (Multi-Level Domain Decom- position Parallel Preconditioners Package based on PSBLAS) in un codice LES ai volumi finiti 2) Analisi delle caratteristiche del sistema lineare algebrico derivante dall’ap- plicazione di un metodo di proiezione alle equazioni di Navier-Stokes 3) Scelta del precondizionatore/metodo di risoluzione più opportuno del siste- ma algebrico 4) Analisi della scalabilità ed efficienza del precondizionatore in termini del numero d’iterazioni e tempo medio di risoluzione. 0 2 4 6 8 10 12 14 16 18 20 0.1 1 10 100 u+ y+ Mean Velocity Profile Near the Wall LES DNS Modello LES con schema ai Volumi Finiti ( ) 1 m x A v v t t () 0 x v ndS ∂Ω = ( ) ( ) ( ) 1 1 m x x A F ndS x v t ∂Ω Ω =− Il costo computazionale di un solver per l’equazione di Poisson (4) in un metodo di proiezione basato sulla decomposizione di Hodge è pari al 70% del costo necessario per un time step dell’intera procedura Il modello LES FV riduce il costo computazionale delle NS ma le simulazioni di flussi tur- bolenti in presenza di pareti solide a Reynolds O(10 6 ) richiedono l’utilizzo di algoritmi di soluzione dei sistemi lineari ad elevate prestazioni e l’utilizzo di macchine a memoria di- stribuita, a causa dei passi d’integrazione spazio/temporali molto ridotti Per la risoluzione dei sistemi lineari derivanti dalla discretizzazione di problemi di CFD è diffusa l’applicazione di metodi di risoluzione di tipo Krylov. Per l’efficienza di tali meto- di è cruciale l’uso di precondizionatori che ne accelerino la velocità convergenza. In que- sto lavoro è analizzato il comportamento di differenti precondizionatori multilivello im- plementati nel package MLD2P4. Interfacciamento del Codice LES con PSBLAS (strutture dati e solver di tipo Krylov) e MLD2P4 (precondizionatori 1) Inizializzazione ed allocazione delle strutture dati di PSBLAS (contengono le informazio- ni relative alla matrice del sistema e agli elementi da scambiare tra i processi) 2) Assegnazione strutture dati e distribuzione delle stesse tra i singoli processi 3) Calcolo del campo di predizione, tale campo è utilizzato per il calcolo del termine noto della (4) 4) Risoluzione del sistema lineare derivante dalla discretizzazione della (4) con un metodo di Krylov associato a differenti precondizionatori multilivello disponibili in ML2DP4 1 n v v t φ + = −Δ∇ ( ) () ( ) () 1 1 x x n dS n v dS x x t φ ∂Ω ∂Ω ⋅∇ = Ω Ω Δ Simulazione LES di un caso test di turbolenza confinata: flusso in un canale Dimensioni del Dominio di calcolo: x (streamwise), z (spanwise) : omogeneità del flusso, ovvero grandezze sta- tistiche della turbolenza invarianti per traslazione Condizioni al contorno lungo x e z Condizioni di non slittamento sulle pareti del canale Condizione iniziale : Flusso alla Poiseuille su u + Perturbazione su u,v,w ,, 0 uvw = y L Precondizionatori algebrici basati sulla Domain Decomposition (DD) Si decompone la matrice del sistema lineare in blocchi di righe corrispon- denti a sottodomini del dominio di partenza del problema Si definisce un precondizionatore locale per ciascuna delle sottomatrici Si costruisce il precondizionatore globale utilizzando quelli locali Precondizionatori multilivello algebrici di tipo DD Il numero d’iterazioni del sistema precondizionato cresce con il numero di sottomini. Per ottenere un precondizionatore ottimale è necessario utilizza- re un’approssimazione del problema di partenza in uno spazio coarse (coarse level correction) La correzione è costruita con un approccio algebrico (indipendente dalla geometria del problema) basato su un algoritmo di aggregazione (smoothed aggregation) Caratteristiche del sistema derivante dalla discretizzazione dell’equazione (4) Sistema singolare (condizioni al contorno alla Neumann) ma compatibile Matrice dei coefficientii sparsa con un pattern di sparsità simmetrico Coefficienti della matrice indipendenti dal passo temporale Soluzione del sistema lineare ottenuta con metodo RGMRES Precondizionatori utilizzati: (one level) Restricted Additive Schwarz preconditioner (RAS) (two level/three level) hybrid Schwarz preconditioner utilizzati con RAS/ILU(0) come precondizionatore di primo livello 1 2 3 4 5 6 7 z L (1) (2) (3) Il vicolo imposto dalla equazione di conser- vazione della massa (2) è imposto risolven- do ad ogni time step l’equazione di Pois- son: La risoluzione delle (2), (3) è effettuata sfruttando la decomposizione di Hodge Continuità Quantità di moto Filtraggio di ordine elevato mediante Campo di predizione Campo di correzione ,, 0 uvw = (4) Speedup medio relativo alla soluzione delle (2 (3), media su 10 passi temporali Tempi medi d’esecuzione relativo alla soluzione delle (2), (3) : media su 10 passi temporali Tempo d’esecuzione relativo alla soluzione del sistema lineare derivante dalla (4) su 1 time units (S.O.R. su 1 proc.. t=9 sec) Tempo d’esecuzione relativo alla soluzione del sistema lineare deri- vante dalla (4) su 1 time units (S.O.R. su 1 proc.. t=8580 sec) Referenze [1] A. Aprovitola, P. D’Ambra, F. M. Denaro, D. di Serafino, S. Filippone, Application of Parallel Algebraic Multile- vel Domain Decomposition Preconditioners in Large-Eddy Simulations of Wall-bounded Turbulent Flows: First Expe- riments, (ICAR-CNR Technical Report, RT-ICAR-NA-2007-02, 2007). [2] A. Aprovitola, F.M. Denaro, On the application of congruent upwind discretizations for large eddy simulations (Journal of Computational Physics, 194, 2004). [3] A. Aprovitola, F.M. Denaro, A non diffusive, divergence free, finite volume-based double projection method on non staggered grids (International Journal for Numerical Methods in Fluids, 53, 2007). [4] A. Buttari, P. D'Ambra, D. di Serafino, S. Filippone, Extending PSBLAS to Build Parallel Schwarz Precondition- ers, in ,J. Dongarra, K. Madsen, J. Wasniewski, editors, Proceedings of PARA 04 Workshop on State of the Art in Scientific Computing (Lecture Notes in Computer Science, 3732, 2005). [5] A.Buttari, P.D'Ambra, D. di Serafino, S.Filippone, 2LEV-D2P4: a package of high-performance preconditioners for scientific and engineering applications, (Applicable Algebra for Engineering, Communication and Computing, 18, 2007). [6] P. D'Ambra, D. di Serafino, S. Filippone, On the development of PSBLAS-based parallel two-level Schwarz pre- conditioners (Applied Numerical Mathematics, 57, 2007). 4 2 43 πδ δ π δ × × 2 2 2 πδ δ πδ × × Re 180 τ = Re 1050 τ = D I A M Seconda Università degli Studi di Napoli Dipartimento di Ingegneria Aerospaziale e Meccanica

Giornata 08

Embed Size (px)

DESCRIPTION

Poster on scientific meeting

Citation preview

Page 1: Giornata 08

APPLICAZIONE DI PRECONDIZIONATORI PARALLELI ALGEBRICI MULTILIVELLO ALLA SIMULAZIONE LES DI UN FLUSSO TURBOLENTO CONFINATO

Andrea Aprovitola (1), Pasqua D’ambra (2), Filippo Maria Denaro (1), Daniela di Serafino (3), Salvatore Filippone (4)

(1) (Dipartimento di Ingegneria. Aerospaziale e Meccanica, Seconda Università degli Studi di Napoli, Via Roma 29, I-81031 Aversa [email protected], [email protected] ) (2) (Istituto di Calcolo e Reti ad Alte Prestazioni, CNR, Via Pietro Castellino 111, I-80131 Napoli, [email protected] ) (3) (Dipartimento di Matematica, Seconda Università degli Studi di Napoli, Via Vivaldi 43, I-81100 Caserta, [email protected] ) (4) (Dipartimento di Ingegneria Meccanica, Università di Roma “Tor Vergata”, Viale del Politecnico 1, I-00133, Roma, [email protected] )

Obiettivo e focal points del lavoro Risoluzione efficiente di sistemi lineari sparsi provenienti dall’applicazione di metodi di proiezione alla simulazione LES di flussi turbolenti confinati su cal-colatori paralleli a memoria distribuita 1) integrazione delle librerie di software numerico PSBLAS (Parallel Sparse

Basic Linear Algebra Subprograms) e MLD2P4 (Multi-Level Domain Decom-position Parallel Preconditioners Package based on PSBLAS) in un codice LES ai volumi finiti

2) Analisi delle caratteristiche del sistema lineare algebrico derivante dall’ap-plicazione di un metodo di proiezione alle equazioni di Navier-Stokes

3) Scelta del precondizionatore/metodo di risoluzione più opportuno del siste-ma algebrico

4) Analisi della scalabilità ed efficienza del precondizionatore in termini del numero d’iterazioni e tempo medio di risoluzione.

0

2

4

6

8

10

12

14

16

18

20

0.1 1 10 100

u+

y+

Mean Velocity Profile Near the Wall

LESDNS

Modello LES con schema ai Volumi Finiti

( )1

mxA

v vt t

−⎡ ⎤⎢ ⎥⎣ ⎦

≅∂ ∂∂ ∂

( )0

x

v ndS∂Ω

⋅ =∫

( )

( ) ( )

1 1mx

xA F ndS

xvt

∂Ω

⎡ ⎤⎢ ⎥⎣ ⎦

⋅Ω

∂ = −∂ ∫

Il costo computazionale di un solver per l’equazione di Poisson (4) in un metodo di proiezione basato sulla decomposizione di Hodge è pari al 70% del costo necessario per un time step dell’intera procedura

Il modello LES FV riduce il costo computazionale delle NS ma le simulazioni di flussi tur-

bolenti in presenza di pareti solide a Reynolds O(106) richiedono l’utilizzo di algoritmi di soluzione dei sistemi lineari ad elevate prestazioni e l’utilizzo di macchine a memoria di-stribuita, a causa dei passi d’integrazione spazio/temporali molto ridotti

Per la risoluzione dei sistemi lineari derivanti dalla discretizzazione di problemi di CFD è

diffusa l’applicazione di metodi di risoluzione di tipo Krylov. Per l’efficienza di tali meto-di è cruciale l’uso di precondizionatori che ne accelerino la velocità convergenza. In que-sto lavoro è analizzato il comportamento di differenti precondizionatori multilivello im-plementati nel package MLD2P4.

Interfacciamento del Codice LES con PSBLAS (strutture dati e solver di tipo Krylov) e MLD2P4 (precondizionatori 1) Inizializzazione ed allocazione delle strutture dati di PSBLAS (contengono le informazio-

ni relative alla matrice del sistema e agli elementi da scambiare tra i processi) 2) Assegnazione strutture dati e distribuzione delle stesse tra i singoli processi 3) Calcolo del campo di predizione, tale campo è utilizzato per il calcolo del termine noto

della (4) 4) Risoluzione del sistema lineare derivante dalla discretizzazione della (4) con un metodo

di Krylov associato a differenti precondizionatori multilivello disponibili in ML2DP4

1nv v t φ

+ ∗= − Δ ∇

( ) ( ) ( ) ( )

1 1

x x

n dS n v dSx x t

φ ∗

∂Ω ∂Ω

⋅∇ = ⋅Ω Ω Δ∫ ∫

Simulazione LES di un caso test di turbolenza confinata: flusso in un canale Dimensioni del Dominio di calcolo:

x (streamwise), z (spanwise) : omogeneità del flusso, ovvero grandezze sta-

tistiche della turbolenza invarianti per traslazione Condizioni al contorno lungo x e z

Condizioni di non slittamento sulle pareti del canale

Condizione iniziale : Flusso alla Poiseuille su u + Perturbazione su u,v,w

, , 0u v w =

yL

Precondizionatori algebrici basati sulla Domain Decomposition (DD) Si decompone la matrice del sistema lineare in blocchi di righe corrispon-

denti a sottodomini del dominio di partenza del problema Si definisce un precondizionatore locale per ciascuna delle sottomatrici Si costruisce il precondizionatore globale utilizzando quelli locali

Precondizionatori multilivello algebrici di tipo DD Il numero d’iterazioni del sistema precondizionato cresce con il numero di

sottomini. Per ottenere un precondizionatore ottimale è necessario utilizza-re un’approssimazione del problema di partenza in uno spazio coarse (coarse level correction)

La correzione è costruita con un approccio algebrico (indipendente dalla geometria del problema) basato su un algoritmo di aggregazione (smoothed aggregation)

Caratteristiche del sistema derivante dalla discretizzazione dell’equazione (4) Sistema singolare (condizioni al contorno alla Neumann) ma compatibile Matrice dei coefficientii sparsa con un pattern di sparsità simmetrico Coefficienti della matrice indipendenti dal passo temporale

Soluzione del sistema lineare ottenuta con metodo RGMRES Precondizionatori utilizzati: (one level) Restricted Additive Schwarz preconditioner (RAS) (two level/three level) hybrid Schwarz preconditioner utilizzati con RAS/ILU(0) come precondizionatore di primo livello

1 2 3

4 5

6 7

zL

(1)

(2)

(3)

Il vicolo imposto dalla equazione di conser-vazione della massa (2) è imposto risolven-do ad ogni time step l’equazione di Pois-son:

La risoluzione delle (2), (3) è effettuata sfruttando la decomposizione di Hodge

Continuità

Quantità di moto

Filtraggio di ordine elevato mediante Campo di predizione Campo di correzione

, , 0u v w =

(4)

Speedup medio relativo alla soluzione delle (2 (3), media su 10 passi temporali

Tempi medi d’esecuzione relativo alla soluzione delle (2), (3) : media su 10 passi temporali

Tempo d’esecuzione relativo alla soluzione del sistema lineare derivante dalla (4) su 1 time units (S.O.R. su 1 proc.. t=9 sec)

Tempo d’esecuzione relativo alla soluzione del sistema lineare deri-vante dalla (4) su 1 time units (S.O.R. su 1 proc.. t=8580 sec)

Referenze [1] A. Aprovitola, P. D’Ambra, F. M. Denaro, D. di Serafino, S. Filippone, Application of Parallel Algebraic Multile-vel Domain Decomposition Preconditioners in Large-Eddy Simulations of Wall-bounded Turbulent Flows: First Expe-riments, (ICAR-CNR Technical Report, RT-ICAR-NA-2007-02, 2007). [2] A. Aprovitola, F.M. Denaro, On the application of congruent upwind discretizations for large eddy simulations (Journal of Computational Physics, 194, 2004). [3] A. Aprovitola, F.M. Denaro, A non diffusive, divergence free, finite volume-based double projection method on non staggered grids (International Journal for Numerical Methods in Fluids, 53, 2007). [4] A. Buttari, P. D'Ambra, D. di Serafino, S. Filippone, Extending PSBLAS to Build Parallel Schwarz Precondition-ers, in ,J. Dongarra, K. Madsen, J. Wasniewski, editors, Proceedings of PARA 04 Workshop on State of the Art in Scientific Computing (Lecture Notes in Computer Science, 3732, 2005). [5] A.Buttari, P.D'Ambra, D. di Serafino, S.Filippone, 2LEV-D2P4: a package of high-performance preconditioners for scientific and engineering applications, (Applicable Algebra for Engineering, Communication and Computing, 18, 2007). [6] P. D'Ambra, D. di Serafino, S. Filippone, On the development of PSBLAS-based parallel two-level Schwarz pre-conditioners (Applied Numerical Mathematics, 57, 2007).

4 2 4 3πδ δ π δ× × 2 2 2πδ δ πδ× ×Re 180τ = Re 1050τ =

D I A M Seconda Università degli Studi di Napoli Dipartimento di Ingegneria Aerospaziale e Meccanica