24
Métadonnées François-Xavier Boffy SID – SCD Lyon 1

Metadonnees -- une typologie

Embed Size (px)

DESCRIPTION

Présentation générale de ce que sont les métadonnées, de quelques questions qu'elles soulèvent, suivie d'une proposition de typologie des standards de métadonnées. Manquent les animations Version 1.1

Citation preview

Page 1: Metadonnees -- une typologie

Métadonnées

François-Xavier Boffy

SID – SCD Lyon 1

Page 2: Metadonnees -- une typologie

M. Jourdain et les métadonnées

DATA META

Les métadonnées sont« des données sur des données » (data about data, cf. Martin).

On pourrait dire aussi,« des données sur du donné »(y compris sur les objets sensibles).

Quand on utilise des données portant sur un objet, on utilise des méta-données.

Page 3: Metadonnees -- une typologie

M. Jourdain et les métadonnées

Villeurbanne 69100

Sous-préfecture

138 000 hab.

On fait des métadonnées depuis très longtemps sans s'en rendre forcément compte...

Page 4: Metadonnees -- une typologie

Exemples de métadonnées

Votre numéro de sécurité sociale – les machines peuvent gérer votre dossier

Vos prénoms – on peut vous identifier plus précisément qu'avec un seul (alternative : date voire lieu de naissance)

Votre taille – on peut savoir quel vêtement (= une autre donnée) pourrait « s'agencer » avec vous; mais elle varie !

La cuisson de la viande au restaurant – question de vocabulaire (bleu, à point...) !

Page 5: Metadonnees -- une typologie

Approche classique

Les métadonnées sont des données sur les données, donc on peut classer les métadonnées selon le type des données

Distinction entre Métadonnées descriptives (du contenu) Métadonnées administratives (droits) Métadonnées de structure (relations) Métadonnées sur les métadonnées

Page 6: Metadonnees -- une typologie

Exemple en Dublin Core qualifié et LOM

title signale le nom d'usage du contenu rights signale des droits sur le document hasPart signale une sous-partie du doc metametadata/contribute (ou 3.2, en

LOM) signale l'origine des métadonnées

Page 7: Metadonnees -- une typologie

Changer de format...

title en DC = champ 240 en MARC embargoDate en PRISM =? en DC

(n'existe pas) creator en DC ≈ %A en Endnote contributor en Zotero ≠ contributor en DC

La conversion d'un format de métadonnées en un autre est déjà délicate à cause de la « grammaire » utilisée par chacun.

Page 8: Metadonnees -- une typologie

Transférer des données...

Titre = La pie voleuse / La Pie voleuse / The Thieving Magpie / ...

Date = “02/12/1977” / “2 décembre 77” / “12/02/1977”

La conversion des métadonnées est rendue difficile aussi à cause des vocabulaires plus ou moins bien contrôlés employés par les utilisateurs / créateurs de métadonnées.

Page 9: Metadonnees -- une typologie

Des questions restent ouvertes, sur la théorie et la pratique :

Quel équilibre entre la richesse des métadonnées et leur interprétabilité ?

Quelles relations entre les différents formats ?

Qui choisit les noms des champs, qui choisit ce qu'on peut y mettre (usagers, éditeurs, instituts de normalisation) ?

Une norme de stockage ou de transmission, un codage de caractères (ex : Unicode) sont-il aussi des standards de métadonnées ?

Page 10: Metadonnees -- une typologie

Si on élargissait le traitement ?

Non seulement DC DC Terms MODS MARC EAD RDF / XML METS RIS...

Mais aussi RAMEAU Z3950 DOCX Endnote (.enl) XML Microformat RFC3361 RDF...

Page 11: Metadonnees -- une typologie

Mon approche La méta-information est un processus de

transmission qu'on peut modéliser de différentes façons

La dialectique entre les fonctionnements du web et les essais de normalisation / standardisation rompt les limites entre données et métadonnées

Dans le cas des données, les FRBR ont proposé une modélisation intéressante

Attention ! Les diapositives qui suivent sont des propositions de modélisation qui n'engagent que leur auteur.

Page 12: Metadonnees -- une typologie

Rappel FRBR

On distingue l'oeuvre (exemple : l'histoire des Misérables

de Victor Hugo) l'expression de l'oeuvre (exemple : le film Les

Misérables inspiré de l'oeuvre d'Hugo) la manifestation de l'oeuvre (exemple : le film

Les Misérables sur DVD édité en 2004) l'item (exemple : 1 exemplaire du DVD)

Page 13: Metadonnees -- une typologie

Et les standardsde métadonnées ?

Pourquoi pas... Règles de conception de métadonnées Règles d'organisation de métadonnées Règles d'expression de métadonnées

Règles grammaticales Règles du vocabulaire

Page 14: Metadonnees -- une typologie

Standard de conception

Standard d'organisation

Standard d'expression grammaticale

Standard d'expressiondu vocabulaire

4 niveaux de régulation des métadonnées

Page 15: Metadonnees -- une typologie

Langages à balise Formats bibliographiques

XMLHTML

TEIDC

MARC

LCSH

RFC3361MeSH

DC-HAL

LOM

La place qu'on peut attribuer à certains standards de méta-information

Page 16: Metadonnees -- une typologie

DC Abstract model

Langages à balise

XML

DC TermsDC

DC-HAL

EuropeanaRFC3361

LCSH

Le DC abstract model contrôle l'emploi des grammaires et des vocabulaires, mais reste sur la conception du XML

RDF

RDF/XML

Page 17: Metadonnees -- une typologie

Langages à balise

XMLMETS

MODS

DC Terms

MADS

LCSHMIX

Le METS peut structurer toutes les organisations et les expressions de métadonnées sur la base du XML

PREMIS

TextMD

Page 18: Metadonnees -- une typologie

Formats bibliographiques

MARC

UNIMARC

MARC21

MARCXML

Langages à balise

XML

Le MARCXML est l'adaptation de MARC21 à la conception des langages à balises de type XML

Page 19: Metadonnees -- une typologie

Microformats

hCardhCal W3CDTF

Les Microformats, standards sans organisation (en caricaturant un peu)

Page 20: Metadonnees -- une typologie

Enveloppe demétadonnées

XMP

PDF

Métadonnéesembarquées

EXIF

L'enrichissement des métadonnées des PDF ou images peut se faire avec une enveloppe de métadonnées en XMP

Page 21: Metadonnees -- une typologie

Fils de métadonnées

RSS PAM

Transmission par lots

Z3950

La transmission des métadonnées peut elle-même être standardisée de diverses manières.

RSS 1.0

RDF

SRU / SRW

CQL

Page 22: Metadonnees -- une typologie

RDF XML

RDF / XML

Mais au fait, où se placerait RDF dans cette modélisation ?

SPARQL

Page 23: Metadonnees -- une typologie

Pourquoi cette typologie ?

Mieux montrer les implications des choix de standard de métadonnées

Mieux évaluer les possibilités de conversion entre les standards à partir des ensembles qu'ils encadrent ou qui leur sont liés

Mieux distinguer ce qui relève d'un choix conceptuel, d'organisation ou de vocabulaire

Garder la possibilité d'inventer de nouveaux modes de méta-information, avec des organisations identiques ou diférentes

Page 24: Metadonnees -- une typologie

Merci

C'est tout... pour le moment !

Continuer vers Ali Sabieh ©2010 Visocrea