18

Click here to load reader

HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

  • Upload
    besa

  • View
    706

  • Download
    0

Embed Size (px)

DESCRIPTION

Hda-Lab ( hdalab.iri-research.org/) est un prototype dédié au tagging sémantique. Il utilise Wikipédia (via DBpedia) comme référentiel sémantique.

Citation preview

Page 1: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

HDA-Lab… suiteQuelques réflexions sur Wiki/DB-pédia et le tagging sémantique

Sémanticpédia, des données culturelles accessibles à tousINHA, 19/11/2012

Bertrand SajusMinistère de la Culture et de la Communication

Département des programmes numériques

Page 2: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

Retour d'expérience

Page 3: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

HDA : un corpus qui se prête à un test de tagging sémantique

Couvre un champ conceptuel très vaste :

Toutes les périodes

Toutes les civilisations

Tous les domaines artistiques

Anthologie de ressources pour l'histoire des arts

Page 4: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

1er constat : Wikipédia répond aux besoins du tagging "culturel"

Analyse provisoire portant sur les 6 premiers mois de l’année 2012 :

77,2 % des tags ont pu être liés à Wikipédia en français

83 % des tags utilisés plus d’une fois par les visiteurs du site Histoiredesarts.culture.fr

100 % des 100 mots-clés les plus fréquemment utilisés par les visiteurs du site Histoiredesarts sont liés à Wikipédia

Mois d’octobre 2012 :

Page 5: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

2ème constat : le tagging par liste de complétion est faisable

Implémentation de la liste de complétion de Wikipédia

Pas de difficulté technique

Appropriation aisée par l’équipe chargée du tagging

Performance technique et expérience utilisateur, un retour positif :

Page 6: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

Cette démarche concerne (entre autres) les données documentaires

Méthode applicable a posteriori à des données structurées

La sémantisation du seul thésaurus enrichit la totalité du corpus

8 semaines pour sémantiser 16000 mots-clés

Page 7: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

Enrichissement /Augmentation

Page 8: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

Le tag augmenté

Désambiguïsation

Gestion de la synonymie

De multiples formes d'enrichissement :

Définitions

Illustrations

Coordonnées géographiques

...

Page 9: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

Accès multilingue

Équivalents linguistiques des mots-clés

Adapté aux données non textuelles

Liens entre les différentes versions linguistiques de Wikipédia

Recherche multilingue

Page 10: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

Interopérabilité

Page 11: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

Interopérabilité sémantique

Approche interdisciplinaire

Désenclavement linguistique et culturel des données

Wikipédia : pivot du tagging et de l'indexation documentaire

Page 12: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

Interdisciplinarité : diversité des vues "métier"

Page 13: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

Désenclavement linguistique et culturel des données

Ex. : Recherche par liste de complétion en français et en japonais Gothique > Gothique international

Accès aux donnéesDéfinition contextuelle

Accès à l'article de Wikipédia en japonais

Français

Japonais

Page 14: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

Contribuer

Page 15: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

Les enjeux de la contribution à Wikipédia

Le Web des données impose un changement de paradigme

Quid de la "pertinence" ?

Le projet Wikipédia : démarche encyclopédique ouverte

Comment donner du sens au déluge des données

Page 16: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

Créer un boucle vertueuse : réutilisation <-> contribution

Deux entrées :

Quels sujets voulons-nous faire connaître à notre public ?

Rationaliser les efforts de contribution à Wikipédia

Quels sont nos sujets les plus recherchés par notre public ?

Page 17: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

Conclusion

Page 18: HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique

"L’Encyclopédie a rendu pensable une rupture"

Dans un sens oui, puisqu’elle repose sur les contributions multiples d’une sorte de société de gens de lettres invisibles. Mais Diderot n’aurait sûrement pas accepté la simple juxtaposition des articles, sans arbre des connaissances ni ordre raisonné, qui caractérise Wikipédia.

[Question à Roger Chartier]L’encyclopédie en ligne Wikipédia n’est-elle pas l’aboutissement du projet de Diderot et d’Alembert ?

"L'Encyclopédie a rendu pensable une rupture", Le Monde des livres, 14 janvier 2010.