Upload
mohamed-imli
View
421
Download
0
Embed Size (px)
DESCRIPTION
Systèmes multi-agents pour la gestion et le contrôle des flux du trafic aérien, cette présentation est basée sur le travail de Adrian Agogino [ Chercheur à NASA ] et kangan Tumer [ chercheur à l'université Oregon State ,USA ]
Citation preview
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Decouverte des parcours SMA
Systemes multi-agents distribues pour le managementet le controle des flux du trafic aerien
Mohamed IMLI
Universite Paris Descartes
13 Decembre 2012
Encadre par Mr : Pavlos Moraitis
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Plan
1 Introduction2 Management des flux du trafic aerien
FACETSysteme d’evaluation
3 Agent Intelligent du Management des flux du trafic aerienChoix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
4 Resultats des simulationsAvec congestion uniqueAvec deux congestions
5 ConclusionMohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Introduction
Gestion des flux du trafic aerien:
Un des defis de l’industrie aerospaciale40000 vols commercials par jour aux Etats-UnisLe systeme actuel est centralise et herarchique : tres lent a reagir auxchangements322272 heures de retard par an !Cout : environ 3 Milliards $ par an !
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Introduction
Gestion des flux du trafic aerien:
Trouver des solutions fiables et evolutives :⇒ importance primordiale
Objectif de NGATS :⇒ acceuillir 3 fois plus de trafic actuel
Probleme naturellement distribue :⇒ Solution naturelle : utilisation d’une approche Multi-agentsune solution pre-determinee et centralisee est fortement sous-optimale !
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Approche Multi-agents
Attribution de l’agent a une position dans un espace 2D⇒ Un plan de vol est une suite de positions
Objectif de chaque agent :⇒ garder la distance de securite entre les avions
Actions :⇒ Accelerer ou ralentir le flux local⇒ Apprentissage par renforcement
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Approche Multi-agents
Attribution de l’agent a une position dans un espace 2D⇒ Un plan de vol est une suite de positions
Objectif de chaque agent :⇒ garder la distance de securite entre les avions
Actions :⇒ Accelerer ou ralentir le flux local⇒ Apprentissage par renforcement
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Approche Multi-agents
Attribution de l’agent a une position dans un espace 2D⇒ Un plan de vol est une suite de positions
Objectif de chaque agent :⇒ garder la distance de securite entre les avions
Actions :⇒ Accelerer ou ralentir le flux local⇒ Apprentissage par renforcement
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Approche Multi-agents
Attribution de l’agent a une position dans un espace 2D⇒ Un plan de vol est une suite de positions
Objectif de chaque agent :⇒ garder la distance de securite entre les avions
Actions :⇒ Accelerer ou ralentir le flux local⇒ Apprentissage par renforcement
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Apprentissage par renforcement
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Methode Monte Carlo
But ?⇒ Calcul de la moyenne d’une variable aleatoire
Principe ?E[f (X)] = ∑
i
f (Xi) (1)
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
FACETSysteme d’evaluation
FACET (Future ATM Concepts Evaluation Tool)
Figure : Facet
Simulateur du trafic aerien developpe par NASA :
Projection des plans de vols dans le temps⇒ tester des algorithmes multi-agents
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
FACETSysteme d’evaluation
Systeme d’evaluation
Fonction d’evaluation des performances du systeme :
G(z) =−((1−α)B(z) + αC(z)) (2)
B(z) : penalite du retard de tous les avions du systemeC(z) : penalite pour la congestion totale du systemez : l’etat actuel du systemeα : Une constante a determiner
L’objectif du systeme : Maximiser G(z)
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
FACETSysteme d’evaluation
Systeme d’evaluation
Fonction d’evaluation des performances du systeme :
G(z) =−((1−α)B(z) + αC(z)) (2)
B(z) : penalite du retard de tous les avions du systemeC(z) : penalite pour la congestion totale du systemez : l’etat actuel du systemeα : Une constante a determiner
L’objectif du systeme : Maximiser G(z)
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Choix de l’agent
Le plus evident ?⇒ Considerer chaque avion comme agent
cette approche pose des problemes :⇒ Un grand systeme massivement multi-agents⇒ L’apprentissage est tres lent
Solution ?⇒ Assigner des agents a des positions sur un espace a 2D⇒ Une zone sur le sol de l’espace aerien⇒ Definie par ses coordonnees
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Choix de l’agent
Le plus evident ?⇒ Considerer chaque avion comme agent
cette approche pose des problemes :⇒ Un grand systeme massivement multi-agents⇒ L’apprentissage est tres lent
Solution ?⇒ Assigner des agents a des positions sur un espace a 2D⇒ Une zone sur le sol de l’espace aerien⇒ Definie par ses coordonnees
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Choix de l’agent
Le plus evident ?⇒ Considerer chaque avion comme agent
cette approche pose des problemes :⇒ Un grand systeme massivement multi-agents⇒ L’apprentissage est tres lent
Solution ?⇒ Assigner des agents a des positions sur un espace a 2D⇒ Une zone sur le sol de l’espace aerien⇒ Definie par ses coordonnees
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Choix de l’agent
Le plus evident ?⇒ Considerer chaque avion comme agent
cette approche pose des problemes :⇒ Un grand systeme massivement multi-agents⇒ L’apprentissage est tres lent
Solution ?⇒ Assigner des agents a des positions sur un espace a 2D⇒ Une zone sur le sol de l’espace aerien⇒ Definie par ses coordonnees
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Architecture du systeme multi-agent
Figure : Schema de l’architecture des agents
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Actions de l’agent
Un choix evident ?⇒ Soumettre les avions aux agents ..
cette approche pose egalement des problemes :⇒ Les plans de vols seront moins fiables et compliques⇒ probleme d’ordonnecement
Solution ?⇒ Action : garder la distance de securite entre les avions⇒ Cette distance s’appelle MIT⇒ L’agent augmente au diminue la distance MIT
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Actions de l’agent
Un choix evident ?⇒ Soumettre les avions aux agents ..
cette approche pose egalement des problemes :⇒ Les plans de vols seront moins fiables et compliques⇒ probleme d’ordonnecement
Solution ?⇒ Action : garder la distance de securite entre les avions⇒ Cette distance s’appelle MIT⇒ L’agent augmente au diminue la distance MIT
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Actions de l’agent
Un choix evident ?⇒ Soumettre les avions aux agents ..
cette approche pose egalement des problemes :⇒ Les plans de vols seront moins fiables et compliques⇒ probleme d’ordonnecement
Solution ?⇒ Action : garder la distance de securite entre les avions⇒ Cette distance s’appelle MIT⇒ L’agent augmente au diminue la distance MIT
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Actions de l’agent
Un choix evident ?⇒ Soumettre les avions aux agents ..
cette approche pose egalement des problemes :⇒ Les plans de vols seront moins fiables et compliques⇒ probleme d’ordonnecement
Solution ?⇒ Action : garder la distance de securite entre les avions⇒ Cette distance s’appelle MIT⇒ L’agent augmente au diminue la distance MIT
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Apprentissage de l’agent
L’agent cherche a maximiser sa recompense⇒ Objectif : apprendre les meilleurs valeurs de MIT
Q(a) = (1− ε)Q(a) + ε(R) (3)
a chaque etape l’agent choisi :
L’action a avec la probabilite : 1− ε
→Exploitation de sa connaissance
Une action aleatoire avec la probabilite : ε
→Exploration des autres actions
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Apprentissage de l’agent
L’agent cherche a maximiser sa recompense⇒ Objectif : apprendre les meilleurs valeurs de MIT
Q(a) = (1− ε)Q(a) + ε(R) (3)
a chaque etape l’agent choisi :
L’action a avec la probabilite : 1− ε
→Exploitation de sa connaissance
Une action aleatoire avec la probabilite : ε
→Exploration des autres actions
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Apprentissage de l’agent
L’agent cherche a maximiser sa recompense⇒ Objectif : apprendre les meilleurs valeurs de MIT
Q(a) = (1− ε)Q(a) + ε(R) (3)
a chaque etape l’agent choisi :
L’action a avec la probabilite : 1− ε
→Exploitation de sa connaissance
Une action aleatoire avec la probabilite : ε
→Exploration des autres actions
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Structure de la recompense de l’agent
Une premiere approche ?⇒ performance du systeme
cette approche n’est pas la meilleure⇒ Ralentissement de l’apprentissage
Solution ?⇒ Considerer la difference de la recompense :
Di = G(z)−G(z− zi + ci) (4)
zi est l’action de l’agent i
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Structure de la recompense de l’agent
Une premiere approche ?⇒ performance du systeme
cette approche n’est pas la meilleure⇒ Ralentissement de l’apprentissage
Solution ?⇒ Considerer la difference de la recompense :
Di = G(z)−G(z− zi + ci) (4)
zi est l’action de l’agent i
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Structure de la recompense de l’agent
Une premiere approche ?⇒ performance du systeme
cette approche n’est pas la meilleure⇒ Ralentissement de l’apprentissage
Solution ?⇒ Considerer la difference de la recompense :
Di = G(z)−G(z− zi + ci) (4)
zi est l’action de l’agent i
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Structure de la recompense de l’agent
Une premiere approche ?⇒ performance du systeme
cette approche n’est pas la meilleure⇒ Ralentissement de l’apprentissage
Solution ?⇒ Considerer la difference de la recompense :
Di = G(z)−G(z− zi + ci) (4)
zi est l’action de l’agent i
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Estimation de la difference de recompense
⇒ Impossible de calculer directement Di
Solution ?⇒ Faire une estimation
Dest1i = Gf (f (z))−Gf (f (z)−E(f (z)/zi) + E(f (z)/ci)) (5)
Dest2i = Gf (f (z))−Gf (f (z)−E(f (z)/zi) + E(f (z))) (6)
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Estimation de la difference de recompense
⇒ Impossible de calculer directement Di
Solution ?⇒ Faire une estimation
Dest1i = Gf (f (z))−Gf (f (z)−E(f (z)/zi) + E(f (z)/ci)) (5)
Dest2i = Gf (f (z))−Gf (f (z)−E(f (z)/zi) + E(f (z))) (6)
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Choix de l’agentActions de l’agentApprentissage de l’agentStructure de la recompense de l’agentEstimation de la difference de recompense
Estimation de la difference de recompense
⇒ Impossible de calculer directement Di
Solution ?⇒ Faire une estimation
Dest1i = Gf (f (z))−Gf (f (z)−E(f (z)/zi) + E(f (z)/ci)) (5)
Dest2i = Gf (f (z))−Gf (f (z)−E(f (z)/zi) + E(f (z))) (6)
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Avec congestion uniqueAvec deux congestions
Simulation avec congestion unique
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Avec congestion uniqueAvec deux congestions
Simulation avec deux congestions
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Avec congestion uniqueAvec deux congestions
Nombre d’agents
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Avec congestion uniqueAvec deux congestions
Influence de α
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Avec congestion uniqueAvec deux congestions
Cout de calcul
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Conclusion
Une solution distribuee adaptative
Pas de changement radical
D’autres pistes ?
Chercher d’autres algorithmes
Etendre la notion d’agent aux secteurs
Mohamed IMLI SMA distribues : Management des flux du trafic aerien
IntroductionManagement des flux du trafic aerien
Agent Intelligent du Management des flux du trafic aerienResultats des simulations
Conclusion
Conclusion
Une solution distribuee adaptative
Pas de changement radicalD’autres pistes ?
Chercher d’autres algorithmes
Etendre la notion d’agent aux secteurs
Mohamed IMLI SMA distribues : Management des flux du trafic aerien