Upload
ninon-philippe
View
113
Download
3
Embed Size (px)
Citation preview
1
Paysages de Fitness et Neutralité
Philippe [email protected]
Projet TEA
Laboratoire I3S
Université de Nice-Sophia Antipolis/CNRS
2
Paysages de Fitness et Neutralité
1. Origine Biologique du concept de neutralité
2. Neutralité = ?
3. Comment mesurer la neutralité ?
4. Les paysages de fitness sont-ils neutres ?
5. Des modèles pour étudier la neutralité
6. Comment exploiter le concept de neutralité?
3
Origines Biologiques Théorie neutraliste de l’évolution
Kimura 1983
Evolution moléculaireCorrespondance génotype/phénotype très
redondanteLarge proportion de mutations sélectivement neutresMoteur principal de l'évolution ?
sélection adaptative rôle des forces stochastiques (dérive génétique)
Dans la nature les populations ne sont pas fixées sur un optimum local
4
Neutralité =Redondance + Opérateur neutre
Ensemble de neutralité (ES)– Ensemble de génotypes d’iso-fitness
Réseau de neutralité (RN)– Connections intra ES par opérateur neutre
RN de taille suffisamment importante «Portes» entre les RNUne large proportion du paysage peut être
approchée par exploration d’un réseauAugmente la probabilité d’atteindre un niveau de
fitness donnée à partir d’une pop aléatoire
5
Du Grimpeur au Nageur …
Ou comment s’échapper d’un optimum local grâce aux mutations ?
6
Marche adaptative sur un paysage de fitness avec neutralité
Succession de phases1. Gain de fitness
2. Dérive aléatoire
7
Neutralité et dynamique évolutionniste
Longues périodes de stabilité (phénotypique)– Dérive dans un réseau de neutralité– Effet d’un opérateur neutre (mutation)
Ponctuées par de rapide augmentation de fitness – Découverte inopinée d’un meilleur mutant– Effet de mutation adaptative rare
Mutation = opérateur neutre ?Rôle du croisement ?Convergence prématurée !
8
Intérêt de la neutralité pour la recherche ou l’optimisation
Donne un moyen de maintenir une certaine diversité génotypique sans risque de perdre les fitness
Potentialité pour s’échapper de certains optima locaux
9
Comment mesurer la neutralité ?
Redondance– Nombre et Taille des RN– Distribution des génotypes selon la fitness (DOS)
Connectivité– intra RN
• Proportion de mutations neutres vs. Fitness• nombre de mutations neutres par génotype (neutral
degree) (Barnett)
– inter RN• Percolation (théorie des graphes)• Taux d’innovation (neutral random walks)• Evolvability (Smith 2002)
10
Densité d’Etats
Distribution des configurations selon les valeurs de fitness
Représente la taille des ensembles d’iso-fitness
Indique la probabilité d’atteindre un niveau de fitness donné
Distribution Normale (binomiale)– Unitation, Paysage NK– SAT, max-CSP, TSP
11
DOS : Paysage NKN=16 K=12
12
Intérêts et Limites du D.O.S
Mesure indépendante du voisinagecodage, voisinage, opérateur
Permet de « situer » une population initiale aléatoire
La « queue » de la distribution est un indice de difficulté
Extension : prise en compte le dynamique – Distribution des Coûts de Processus (Hao &
Belaidouni)
13
Les paysages académiquessont-ils neutres ?
Fonctions de De Jong– Redondance induite par la modalité
Redondance– Unitation : redondance– NK : redondance
Redondance + Mutation neutre– Royal Road
14
Fonction Royal Road(Holland, Forrest, Mitchell 95)
N = 3 blocs * 10 bits
sopt=111111111111111111111111111111 3
s3 =********************1111111111 +1
s2 =**********1111111111********** +1
s1 =1111111111******************** +1
4 réseaux de neutralité– fitness 3 : 1– fitness 2 : ~ 3.103
– fitness 1 : ~ 3.106
– fitness 0 : ~ 109
15
Fonction Royal Road Crutchfield & al. 99
MutationPositive (adaptative) : rare
1111101111********************
Négative (délétère) : rare1111111111********************
Neutre : les plus fréquentes1000000001********************
Pop 250Probabilité de mutation 0.005
16
Fonction Royal Roadfitness vs. générations
17
Fonction Royal RoadPopulation vs. générations
Population=(P0,P1,P2,P3)
Pi = proportion de chaînes de fitness i
18
Les paysages « réels » sont-ils neutres ?
Evolution of neural network controllers in robotic
Silicon chip electronic circuit evolution (FPGA) (Harvey ICES96)
Circuit de reconnaissance de la parole (Thompson 2001)
19
Des modèles pour étudier la Neutralité
Modèle basé sur les fonctions Royal Road– Labyrinthe en Terrasses
Modèle basé sur les paysages NK (random)– NKp ‘probabilistic NK’– NKq ‘quantised NK’
20
Terraced Labyrinth fitness function Crutchfield & al. 99
Fitness déterminée par un arbre
Nœud : réseau de neutralité– Schéma– Fitness associée
Constellation : zone de transition– mutuellement exclusives sur un même nœud
Branche : portail entre réseaux adjacents– instanciation d’une constellation
Sous-nœud : réseau de meilleure fitness– spécialisation de schéma
21
Labyrinthe en terrasses
*************** 1
00000**********
2
00000**111*****
4
00000**111**110
6
000001011100110
8
11111**********
3
11111***0101101
4
11111***1100010
5
111110000101101
7
111110011100010
6
22
Labyrinthe en terrasseset mutations
Mutation adaptative– rare– Contrôlée par la taille des constellations
Mutation neutre– Fréquente (muter sur une constellation)– diminue quand la fitness augmente
Mutation délétère– augmente avec la fitness– 1 seule mutation peut « ramener » à la racine
23
Des modèles pour étudier la Neutralité
Modèle basé sur les fonctions Royal Road– Labyrinthe en Terrasses
Modèle basé sur les paysages NK (random)– NKp ‘probabilistic NK’– NKq ‘quantised NK’
24
Paysages NKKauffman 1993
N = longueur du chromosomeK = degré d’épistasieFitness additive
– des contributions de chaque gène
– Contribution d’un gène dépend• Allèle du gène• Allèles de K autres gènes
– K=0 : fitness linéaire (smooth landscape)– K=N-1 : fitness aléatoire (rugged landscape)
25
•DOS binomiale•Mutations neutres très rares
Paysages NK : K=2Kauffman 1993
26
Paysages NKp Barnett 1998
Paysages NK + neutralitép=probabilité qu’une contribution soit nulle
• p=0 : paysage NK (pas de neutralité)• P=1 : paysage plat
La probabilité qu’une mutation soit neutre augmente avec p
27
Paysages NKp : K=2Barnett 1998
28
DOS : N=16 K=12 p=0.8
29
NKp : proportions des mutations neutresN. Geard & al. (CEC 2002)
30
Innovation le long d’un RNHuynen 1996, Barnett 1998
On comptabilise le nombre de phénotypes « innovants » rencontrés dans le voisinage du chemin aléatoire neutre (neutral walks) sur le RN
31
N=20 K=4 pop=1000 mutation=0.001
p=0
p=0.99
32
Paysages NKq Newman & Engelhardt 1997
Les contributions à la fitness sont des entiers dans [0..q] (quantised NK)
Intuitivement on construit un paysage NK en « terrasses »
La probabilité qu’une mutation soit neutre diminue avec q
Le nombre de réseaux de neutralité augmente exponentielle avec N
Percolation dans les plus grands réseaux de neutralité
33
Paysages NKq : K=2 q=2Newman & Engelhardt 1997
34
DOS : N=16 K=12 q=2
35
NKq : proportion des mutations neutresN. Geard & al. (CEC 2002)
36
Comparaisons : NKp, NKqN. Geard & al. (CEC 2002)
Distribution des mutations neutres– Quand la fitness augmente :
• Le nombre de mutations négatives augmente• Le nombre de mutations positives diminue
– NKp• Le nombre de mutations neutres diminue avec la fitness
– NKq• Le nombre de mutations neutres est maximum pour la
fitness moyenne
37
Meilleure fitness atteinte vs. NeutralitéN=20 K=4
Random hill-climber– moyenné sur 10 simulations
Stratégie : – sélectionner un 1-mutant au hasard– jusqu’à trouver une meilleure solution– ou une solution équivalente
Le processus de recherche s’arrête sur un réseau de neutralité qui ne percolate pas
38
Meilleure fitness atteinte vs. NeutralitéN=20 K=4
q
39
Comment exploiter le concept de neutralité en Evolution artificielle ?
Etudier la neutralité intrinsèque– Redondance (DOS)– Connectivité (intra/inter)
Neutralité synthétique– Introduire de la redondance
• codage• bruit dans le calcul de la fitness• Méta codage (stratégies d’évolution)
– Concevoir des opérateurs neutres• Exploiter les symétries
40
Neutralité synthétique
Spécifique– Choix du codage– Choix des opérateurs
• Neutre• Recombinaison
Indépendante du problème– Neutralité synthétique minimale
41
Voyageur de commerce24 villes concentriques
Concevoir un Opérateur neutre – Exploiter les symétries du
problème
– « Compatible » avec le croisement (PMX)
42
Voyageur de commerceOpérateur neutre et Symétrie
43
Voyageur de commercesolution optimale
44
Neutralité synthétique
Spécifique– Choix du codage– Choix des opérateurs
• Neutre• recombinaison
Indépendante du problème– Neutralité synthétique minimale
45
Neutralité synthétique minimale P. Collard & al. (EA 99)
Dualité : neutralité synthétique minimale
Mapping génotype/phénotype
f : RMapping étendu
F : {0,1}x R
F(0x) = f(x)
F(1x) = f(x)
46
Neutralité synthétique minimale
Redondance F : {0,1} * R F(x)=F(x)
Invariance de la Densité d’Etats
Contraction de la distance Hammingd(0000,1111)= d(00000,10000)=1
d(0000,0011)= /2 d(00000,11100)= /2
Opérateur neutre : mirroringx x
47
Neutralité synthétique minimale Etude expérimentale
200 bits100 chromosomes1000 générationsMutation 0.5 par chromosomeMirroring 0.02Croisement 0.7Tournoi
48
Trajectoire du centroïdesans neutralité
49
Neutralité synthétique d’ordre 1Trajectoire du centroïde
50
Neutralité synthétique d’ordre 1Mean/max fitness
51
Neutralité synthétique d’ordre 1Proportion cumulée des génotypes
52
Conclusion
Peu de résultats théoriques ou empiriques sur la structure des paysages neutres
Résultats sur des paysages simples ou idéalisés
Etudier le rôle du croisementEtudier la neutralité intrinsèqueConcevoir des opérateurs neutres
53
Conclusion
Tthere is still a fundamental lack of both empirical data and theoretical understanding concerning the structure of neutral landscapes
Many of the analytical results have been obtained from simplified or idealised landscapes
The extent to which these results apply to the more complex landscapes likely to be found in real world problems has not yet been demonstrated
The goal of this study was to broaden knowledge of landscapes with neutrality by investigating structural properties of the NKp landscape model (Barnett 1997, 1998) and the NKq landscape model (based on Newman & Engelhardt 1997) using Kauffman’s original NK model for comparison. Initially, Kauffman’s simulations pertaining to NK landscapes were replicated. Next, these simulations were extended to the neutral NKp and NKq landscapes. A series of comparative simulations were carried out to investigate the performance of several different search algorithms on a variety of neutral and non-neutral landscapes.
Finally, a simulation was developed to investigate the role of crossover in maintaining genetic diversity in a population evolving on a neutral landscape. It was found that hill-climbing algorithms are generally capable of finding better individual solutions, but population-based algorithms tend to find higher average solutions. It was also found that crossover allows a population on a neutral landscape to maintain a much higher level of genetic diversity on a neutral layer than a population using mutation alone
Furthermore, populations using crossover suffer a less dramatic loss of diversity when a new fitness level is discovered, and recover diversity more rapidly.
54
55
Paysages NKpBarnett 1998
‘Probabilistic NK’Capture some of the lethal mutations in
biologyLe paramètre de neutralité p a peu
d’effet sur la corrélation
56
Distributions des mutations neutresN. Geard & al. (CEC 2002)
57
Epistasie vs. Neutralité
Mesurer l’effet d’une mutation sur le fitness– Principe de causalité– Effet neutre
Expérience en Robotique (T. Smith 2002)
– Ajouter de la neutralité et Diminuer l’épistasie favorise l’évolution
58
Frozen accidents
*************** 1
00000**********
2
00000**111*****
4
00000**111**110
6
000001011100110
8
11111**********
3
11111***0101101
4
11111***1100010
5
111110000101101
7
111110011100010
6
59
Concevoir des Opérateurs neutres
Unitation / Inversion
000111000111
000000111111
Inversion / croisement
000111000111 000111111111
000000111111 000000000111
60
Questions
Echantillonnage pour le dosStratégie d’évolutionSmith 2002 evolvability