Upload
vidal
View
24
Download
4
Embed Size (px)
DESCRIPTION
Hervé Goëau. Structuration de collection d’images par apprentissage actif crédibiliste . 25 mai 2009. Motivations. Valoriser des fonds de collections d’images Contexte INA : Photothèque Contexte « grand public » : collections personnelles de photographies. Plan Introduction - PowerPoint PPT Presentation
Hervé Goëau
25 mai 2009
Structuration de collection d’images par apprentissage actif crédibiliste
1
2
MotivationsValoriser des fonds de collections d’images• Contexte INA : Photothèque• Contexte « grand public » : collections personnelles de photographies
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion Bateaux
Plage
Montagnes
Famille
3
Systèmes existants1. Manuel
+expressivité, ergonomie
- fastidieux
2. Automatique
+ productivité
- satisfaction
3. Semi-automatique
+ expressivité, contrôle utilisateur
- peut être fastidieux
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
4
Objectifs et contraintes
• Semi-automatique
• Collections vierges
• Satisfaction totale de l’utilisateur- Capturer ses intentions- Diminuer sa charge de travail
• Une ou plusieurs catégories par image
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
5
Proposition
Choix d’une stratégie de sélection
Sélection active
d’images
Utilisateur
Modélisation et synthèse de
la connaissance
Nouvel état des étiquettes
Images étiquetées
Images non
étiquetées
Interface homme machine
Liste(s) d’images
Etats de connaissance
Interactions
Etiquetages
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
6
Modélisation et synthèse de la connaissance
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
7
Problématique
« plages »« monuments »
« éléphants »
? ?
?
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
? Ø
8
Contenus visuels
Croyance que u appartient à la même classe de lq ?
Fossé sémantique? Appartenances multiples?Combinaisons ?
Non étiquetée u Étiquetée lq
Descriptions couleurs, orientations
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
9
Fonction de croyances (1/3)
Cadre de discernement :
Espace puissance :
conflit doute
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
Modèle des Croyances Transférables [Smets94]
Distribution de masses (KnnEv [Denoeux95]) :
10
Fonction de croyances (2/3)
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
Knn « négatifs »
Adaptation locale des fonctions de croyances
Paramètre f : croyance aux frontières des classes
11
Fonction de croyances (3/3)
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
Paramètre f : gestion des croyances aux frontières des classes
u
12
Combinaison de témoignages
• Problème : masse sur la proposition ?
• Règle de combinaison conjonctivePlan
IntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
13
Transfert de masses
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
Multi-classe
• produit des cadres de discernement « locaux »
Exemple pour 2 classes : 4 hypothèses
Combinaison des distributions de masses l’opérateur « d’extension vide » [Smets93]
14
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
15
Multi-descripteur
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
16
Modélisation de la connaissance : bilan
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
Extension du KnnEv
connaissance détaillée : • Appartenance une ou plusieurs classes• Non appartenances• Doutes et conflit• Adaptation locale
17
Sélection active d’imagesPlan
IntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
18
Apprentissage actif
• Classer les échantillons les plus « informatifs »
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
« Vérité terrain »Modèle idéalt0
19
Apprentissage actif
• Classer les échantillons les plus « informatifs »
Adéquation ?
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
t0
Stratégie 1 Stratégie 2
t1t2t3t4
• Pour l’apprentissage • Pour l’utilisateur
Stratégies de sélections
- rejet en distance
- positives
localesglobale
- ambigües
Transformation pignistique [Smets05] PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
20
Hypothèses :
21
Stratégie du plus positif
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
Recherche des étiquettes les plus
probables
Premiers sélectionnés
Derniers sélectionnés
22
Stratégie du plus rejeté en distance
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
Exploration de nouveaux
contenus visuels
Premiers sélectionnés
Derniers sélectionnés
23
Stratégie du plus localement ambigu
Désambigüisation des classes 2 à 2
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
Premiers sélectionnés
Derniers sélectionnés
24
Sélection active d’images : bilan
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
Expression des stratégies usuelles avec le MCT
Stratégies complémentaires pour identifier et cerner les classes
25
Interface homme-machinePlan
IntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
26
Proposition automatique d’étiquette(s)
Exemple à 3 classes
Etiquetage sans rejetsEtiquetage avec rejet en distanceEtiquetage avec rejet en ambigüitéou étiquetage multiple sans rejetsEtiquetage avec rejetsou étiquetage multiple avec rejet en distance
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
27
Interface et démonstration
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
28
EvaluationsPlan
IntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
29
Classification automatique et multi-étiquetage
scene-classification [Boutell04]6 classes Corel1,08 étiquettes/image1211 apprentissage / 1196 test
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
30
Caractérisation des stratégies (1/3)
5x100 images CorelClasses visuellement homogènesPlan
IntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
Evolution
Nombre final de mauvaises propositions
Effort de l’utilisateur
31
Caractérisation des stratégies (2/3)
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
f = 0,4
32
Caractérisation des stratégies (3/3)
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
f = 0,7
33
Combinaison avec des métadonnées
Combinaison avec des informations imprécises et partiellesEx : date de prise de cliché
1820 photographies, 24 appareils, 6 événements temporels
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion Préparatifs Séance photos Mairie Cérémonie Soirée Lendemain
34
Combinaison avec des métadonnées
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
35
Evaluation avec utilisateur
Documentaliste responsable de la Photothèque InaMéthodologie « penser à haute voix » [Nielson92]Téléfilm Borgia
↗ Une même classe avec contenus visuels différents ↗ Réorganisation à volonté des classes ↗ Prise en main de l’interface ↗ Adéquation avec usage
↘ Prise en main des stratégies non immédiate
Suggestions :- Vue d’ensemble pour initialisation des classes- Hiérarchie
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
36
Conclusion
Verrous levés : • Satisfaction totale• Peu d’échantillons• Multi-étiquetage• Tout type de collections d’images
Cadre de formalisation : • Classification, stratégies, décisions• Modélisation du doute et du conflit• Echelle
Souplesse :• Gestion des classes : modification/création/suppression à la volé• Ajout de nouveaux descripteurs de contenus et métadonnées
Prototype : tests opérationnels
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
37
Perspectives (1/3)
• Optimisations et autres tests :
- Adaptation automatique des fonctions de croyances
- Descripteurs (locaux) et métriques
- Classifieurs de base
• Semi-supervisé :
- Structuration partielle de très grandes bases d’images
- Structuration de vidéos
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
38
Perspectives (2/3)
• Combinaison/alternance de stratégies
plus de propositions correctes
améliorer le confort de l’utilisateur
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
1 MR, X MP
39
Perspectives (3/3)
• Organisations hiérarchiques
Formalisation de « sur-classes » et « sous-classes »
Multi-étiquetage sur différents niveaux hiérarchiques
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
40
Merci pour votre attention
PlanIntroductionModélisation de la connaissanceSélection active d’imagesInterface et démonstrationEvaluationsConclusion
41
Compléments
42
DESCRIPTEURS MPEG7 (1/2)
Descripteur Nombre de corrections finalHrgb 33Hhsv 33Cced 35Scd 35Cfct 37Hlab 39Hluv 46Horient 54MPEG7cld 58MPEG7ehd 68MPEG7scd 399
5x100 images CorelDescripteurs standards (Rummager )Stratégie du plus rejeté en distance MRk=5,f=0.7,distance de Bhattacharya
43
DESCRIPTEURS MPEG7 (2/2)
5x100 images CorelDescripteurs standards (Rummager )Stratégie du plus rejeté en distance MRk=5,f=0.7,distance de Bhattacharya
44
Fusion précoce et tardive
Réglage automatique du paramètre f
Influence du paramètre f
47
Transformation d’étiquettes
PT3
PT4
PT6
48
Structuration de vidéos (1/4)
Structuration de vidéos (2/4)
Structuration de vidéos (3/4)
Structuration de vidéos (4/4)
52
Stratégie orientée classe Vue locale
53
Stratégie orientée classe Vue globale