35
1 ENST Bretagne, département IASC 12/12/0 2 Introduction aux classes empiétantes François Brucker [email protected] Brest (Breizh)

ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker [email protected] Brest (Breizh)

Embed Size (px)

Citation preview

Page 1: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

1

ENST Bretagne, département IASC

12/12/02

Introductionaux

classes empiétantes

François Brucker

[email protected]

Brest (Breizh)

Page 2: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

2

ENST Bretagne, département IASC

12/12/02

‘‘Définition générale de la classification’’ : Le seul moyen de de faire une méthode instructive et naturelle,

c’est de mettre ensemble les choses qui se ressemblentet de séparer celles qui diffèrent les unes des autres.

Georges Leclerc de Buffon, naturaliste et écrivain, Histoire naturelle,1749.

2 grands types de critères :

• globaux (au niveau des classes)• locaux (au niveau des objets)

Page 3: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

3

ENST Bretagne, département IASC

12/12/02

Une définition d’une classe

Ensemble X d’objets

Relation R

Symétrique (x R y y R x)

Réflexive (x R x pour tout x de X)

On associe à R un graphe GR=(X,E)

C est une classe de X C est une clique maximale de GR

Page 4: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

4

ENST Bretagne, département IASC

12/12/02

Une classification de (X,R)

(X,R) GR {C1, C2, …, Cp}

Ensemble de cliques maximales

Page 5: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

5

ENST Bretagne, département IASC

12/12/02

Classification particulière

Partition

Critère global : Critère local :

Relation d’équivalence

• réflexive• symétrique• transitive

x R y et y R z x R zA B {A,B

Page 6: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

6

ENST Bretagne, département IASC

12/12/02

non empiétance transitivité

Classe A Classe B

ami

moi

ami

Page 7: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

7

ENST Bretagne, département IASC

12/12/02

y

x

z

t

On regarde par rapport à 2 éléments

Relation 2-transitive (Jardine et Sibson, 1971)

Page 8: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

8

ENST Bretagne, département IASC

12/12/02

Se généralise à 3, 4, ..., n éléments.

x

y

z

Relation n-transitive (Jardine et Sibson, 1971)

Page 9: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

9

ENST Bretagne, département IASC

12/12/02

Les classes formées par ces modèles relationnels

Page 10: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

10

ENST Bretagne, département IASC

12/12/02

Une définition d’une classe

Ensemble X d’objets

On associe à chaque d(x,y)= un graphe G=(X,E)

C est une classe de X C est une clique maximale d’un G

Dissimilarité : d : X Rd(x,y)=d(y,x)d(x,y) 0d(x,x)=0

telle que

Propre si d(x,y)=0 x=y

Page 11: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

11

ENST Bretagne, département IASC

12/12/02

Classification particulière

Arbre hiérarchique

Ultramétrique : U

u(x,y) max{u(x,z),u(z,y)}

A B {A,B

Page 12: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

12

ENST Bretagne, département IASC

12/12/02

Le cas des hybrides

Page 13: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

13

ENST Bretagne, département IASC

12/12/02

Page 14: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

14

ENST Bretagne, département IASC

12/12/02

Réticulogramme

x

yz

t

u

v

w

Page 15: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

15

ENST Bretagne, département IASC

12/12/02

Distance additive d’arbre

x

yz

t

u

v

w

Ce n’est pas à proprement parler un système de classes

Page 16: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

16

ENST Bretagne, département IASC

12/12/02

Autre problème où l’empiétance est nécessaire : la sériation

Le problème est ici de classer des objets par ordre chronologique, les objetsétant décrit par une dissimilarité.

Une classification est alors la donnée d’un ordre compatible avec la dissimilarité

Page 17: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

17

ENST Bretagne, département IASC

12/12/02

Lien entre sériation et classes

À la différence du modèle arboré, le problème de sériationest lié à un modèle de classe particulier : les hypergraphes d’intervalles

x y z t

Les classes d’une dissimilarité d sont un hypergraphe d’intervalleSi et seulement si il existe un ordre tel que toute classe de d

soit un intervalle de cet ordre.

Page 18: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

18

ENST Bretagne, département IASC

12/12/02

Lien entre dissimilarités et classes

Il existe des bijections entre dissimilarités et classes

transformer une dissimilarité quelconqueen une dissimilarité d’un type particulier.

Dans ce cas, classifier c’est :

• ultramétriques hiérarchies (Jardine, Jardine et Sibson, 1967, Johnson, 1967, Benzecri, 1973)• dissimilarités fortement de Robinson pseudo-hiérarchies indicées (Durand, 1989)• quasi-ultramétriques quasi-hiérarchies indicées (Diatta et Fichet, 1994)

Les modèles de classe associés aux modèles de distancecorrespondent à des visions classificatoires différentes

Page 19: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

19

ENST Bretagne, département IASC

12/12/02

Les k-ultramétriques(Jardine et Sibson, 1971)

Pour tout S X, |S|=k, a,b X : d(a,b) max{d(x,y) | x S {a,b}, y S}

Définition :

ie. Sur k+2 points, les deux plus grandes dissimilarités sont égales

d est une dissimilarité k-ultramétrique sur X ssi :

Intérêt : rendre compte des relations de k-transitivités

Page 20: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

20

ENST Bretagne, département IASC

12/12/02

d est une dissimilarité fortement de Robinson sur X ssi :

• Il existe un ordre sur X • pour tout x y z d(x,z) max{d(x,y),d(y,z)}

• pour tout x y z• pour tout z t : d(x,z)=d(y,z) d(x,t)=d(y,t)• pour tout t x : d(x,z)=d(x,y) d(y,t)=d(z,t)

Définition :

Les pyramides(Diday, 1984 ; Fichet, 1984)

x y z t

Intérêt : problèmes de sériation

Page 21: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

21

ENST Bretagne, département IASC

12/12/02

Les quasi-ultramétriques(Diatta et Fichet, 1994)

x y

z t

d est une dissimilarité quasi-ultramétrique ssi : pour tout {x,y,z,t} X :max { d(x,z), d(z,y) } d(x,y) d(z,t) max { d(t,x), d(t,y), d(x,y) }

Définition :

Intérêt (1/2): l’intersection de 3 classes est toujours l’intersection de 2 d’entres elles

Page 22: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

22

ENST Bretagne, département IASC

12/12/02

Les quasi-ultramétriques :Intérêt (2/2)

y

x

z

t

1. Les 2-boules sont exactement les cliques maximales (calculabilité)

2. L’intersection de 2 cliques maximales est une clique maximale (stabilité)

Page 23: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

23

ENST Bretagne, département IASC

12/12/02

Relation entre les différents modèles

ultra-métrique

quasi-ultramétrique

3-ultramétriquefaible

(etc.)

pyramides

distance d’arbre

Page 24: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

24

ENST Bretagne, département IASC

12/12/02

• ultramétrique dendrogrammes

Problème : visualisation des classes d’une dissimilarité.

Visualisation des classes

• Modèles « classiques » : • Quasi-ultramétrique ?

• pyramides

1

2

3

4

5

6

Page 25: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

25

ENST Bretagne, département IASC

12/12/02

Classes sur un chemin

x y z t

x y z t u vx y z t u v

x y z t

Page 26: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

26

ENST Bretagne, département IASC

12/12/02

Classes sur un circuit

Page 27: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

27

ENST Bretagne, département IASC

12/12/02

Classes sur un arbre

Page 28: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

28

ENST Bretagne, département IASC

12/12/02

Visualisation 3D

Page 29: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

29

ENST Bretagne, département IASC

12/12/02

Exemple : distance de mutation

Nombre de positions dans la protéine cytochrome-c où deux espèces ont deuxacides aminés différents (Fitch et Margoliash, 1967)

Page 30: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

30

ENST Bretagne, département IASC

12/12/02

Ultramétrique sous dominante

Page 31: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

31

ENST Bretagne, département IASC

12/12/02

Page 32: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

32

ENST Bretagne, département IASC

12/12/02

Page 33: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

33

ENST Bretagne, département IASC

12/12/02

Page 34: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

34

ENST Bretagne, département IASC

12/12/02

Page 35: ENST Bretagne, département IASC 12/12/02 1 Introduction aux classes empiétantes François Brucker francois.brucker@enst-bretagne.fr Brest (Breizh)

35

ENST Bretagne, département IASC

12/12/02