Medialille evolutions catalogage_avril2014_web-donnees

  • Published on
    28-Dec-2014

  • View
    265

  • Download
    0

Embed Size (px)

DESCRIPTION

Support 4 (web de donnes) des journes de formation sur l'volution des catalogues organises par MdiaLille et le groupe technique sur l'adoption de RDA en France.

Transcript

  • 1. Web de donnes/ web smantique : de quoi parle-t'on ? Quels impacts possibles sur les bibliothques ?
  • 2. Architecture du Web (1) World Wide Web : toile d'araigne de serveurs d'informations relis les uns aux autres par des liens physiques (le rseau matriel) et des liens logiques (les liens hypertextes) Architecture du Web = les standards dfinissant linfrastructure technologique Rle du W3C (World Wide Web Consortium) : soccupe de la standardisation de larchitecture du Web
  • 3. 44 Les objectifs du W3C Accessibilit pour les logiciels et machines Interoprabilit et portabilit Production de contenu Web facilite Rduction du volume des pages Meilleure visibilit et indexation par les moteurs de recherche Compatibilit Prennit des documents Accessibilit universelle aux contenus Pas trs loignPas trs loign des missions desdes missions des bibliothquesbibliothques publiques tout a !!publiques tout a !!
  • 4. Architecture du Web (2) Repose sur 3 technologies : Un protocole : HTTP (Hypertext Transfer Protocol) Un langage : HTML (Hypertext Markup Language) Standard dfini par le W3C pour la diffusion de documents sur le Web pour pouvoir afficher de l'information l'aide de balises dont le nombre est limit. Il est interprt par le navigateur Des identifiants : URI (Uniform Resource Identifier) Ressource identifies de manire univoque par une URI : chane de caractres normalise permettant d'identifier de manire permanente une ressource abstraite ou physique, accessible ou non sur Internet (personne, organisme, lieu, vnement, concept, )
  • 5. Architecture du Web - prcisions On peut classer les ressources sur le web en 2 grandes catgories : les ressources informationnelles : ressources dont on peut obtenir le ou les contenus en ligne (une reprsentation via HTTP), comme une page web ou une image par exemple les ressources non-informationnelles : ressources dont on ne peut pas obtenir de reprsentation via HTTP mais sur lesquels on va diffuser des informations (ex. : un objet, un monument, un lieu, un concept)
  • 6. volutions du web Web 1.0 web de documents permet aux usagers de naviguer facilement sur Internet en utilisant des liens hypertexte une page = un document format : HTML (HyperText Markup Language) ne permet que la mise en forme Web 2.0 web collaboratif volution du Web du point de vue des technologies employes et des usages Internet nest plus simplement un media mais une plate-forme de services et d'applications en ligne Permet aux internautes d'interagir sur le contenu des pages et de dialoguer entre eux
  • 7. Le Web de documents Base de donnes Donnes Documents/pages Base de donnes Hyperlien Parfois Inspir deYann Nicolas, Le Web de donnes, enssib, 11 octobre 2012 Notice catalogr. d1 document (article) Notice catalogr. d1 document (DVD) Notice avec beaucoup, de donnes qui alimentent un catalogue avec encore plus de donnes Autre notice, autre base et toujours des donnes Encore des donnes comme le palmars du prix Louis Delluc par exemple Dossier pdagogique sur Les parapluies de Cherbourg Lanne 1963 en France Une multitude dinformations mais trs peu de connexions entre elles
  • 8. Limites du Web de documents MARC, sors de ta chambre ! Va jouer dehors avec les autres !
  • 9. Le Web de donnes ? Web de donnes ou Linked Data ou Web of Data Mouvement de lOpen Data Mise disposition de donnes publiques ouvertes (etalab, creative comm.) librement accessibles sans restriction de copyright, licence payante Donnes pouvant tre rutilises, reproduites, redistribues librement et sans discrimination (cf. http://www.opendefinition.org/okd/) + Mise en relation pour construire un rseau global qui permet, partir dune donne, daccder aux autres donnes lies du Web
  • 10. Le Web de donnes ? Un Web constitu de donnes accessibles, structures, dans un format non-propritaire, identifies et lies entre elles smantiquement (Dfinition de Tim Berners-Lee ds 1999) Objectif : Mettre disposition des donnes en utilisant des techniques standardises qui garantissent linteroprabilit :
  • 11. Pour avoir des donnes 5 toiles, il faut : 1. Que ces donnes soient publies sur le web selon des licences libres (de type creative commons comme la licence ouverte dETALAB). 2. Que ces donnes soient lisibles par des humains bien-sr, mais aussi par des machines. 3. Que ces donnes soient encodes dans des formats informatiques non propritaires. 4. Que ces donnes soient en RDF ou compatibles RDF. 5. Que ces donnes en RDF soient lies sur le web dautres donnes en RDF.
  • 12. Le Web de donnes Base de donnes Donnes Documents/pages Base de donnes Hyperlien Parfois Inspir deYann Nicolas, Le Web de donnes, enssib, 11 octobre 2012 Notice catalogr. d1 document (article) Notice catalogr. d1 document (DVD) Notice avec beaucoup, de donnes qui alimentent un catalogue avec encore plus de donnes Autre notice, autre base et toujours des donnes Encore des donnes comme le palmars du prix Louis Delluc par exemple Dossier pdagogique sur Les parapluies de Cherbourg Lanne 1963 en France Une multitude dinformations mais trs peu de connexions entre elles Une multitudeUne multitude dinformations etdinformations et des connexionsdes connexions entre elles = le webentre elles = le web devient une vastedevient une vaste base de donnes etbase de donnes et non un espace onon un espace o coexistent descoexistent des bases de donnes.bases de donnes.
  • 13. Voil ce quoi rvent nos machines
  • 14. RDF RDF = Resource Description Framework Standard permettant de dcrire les ressources Web et mtadonnes qui y sont associes Propos en 1999 par le W3C Permet de dcrire, reprsenter et relier simplement toute ressource du Web : page Web, image, video, personne, objet, vnement, produit, service, tout ce qui peut tre identifi par un URI peut tre considr comme une ressource Objectif : partager les mtadonnes pour des ressources identiques par lutilisation dune syntaxe commune applicable tous les domaines
  • 15. RDF ?? Cest aussi simple que a : SUJET OBJET PREDICAT Sujet : Charles Darwin Objet : The origin of species Prdicat : A crit = Creator Principe de base : toute chose peut tre dcrite avec des phrases minimales composes dun verbe, dun sujet et dun complment = dclaration RDF
  • 16. RDF : modle de graphe Chaque membre du triplet est une ressource qui peut tre le sujet ou lobjet dautres dclarations On construit ainsi un modle de graphe
  • 17. EXEMPLE DE GRAPHE estn est un a cr est une reprsente est mort est le fils de est contemporainde a inspir est situ 1824 estn en est n en 1850est mort en Alexandre Dumas1802 lieu gographique Alexandre Dumas Honor de Balzac Paris uvre romanesque Marie Duplessis estune uvre lyrique a cr Giuseppe Verdi a t cr Venezia Teatro la Fenice est morte est ne en
  • 18. RDF : lever toute ambigit pour les machines Alexandre Dumas est n Paris Paris ??? Alexandre Dumas ???
  • 19. De MARC RDF ? Les donnes des catalogues en MARC sont trs structures, et donc r exploitables. Tout le travail effectu jusqu prsent nest donc pas perdu (ouf !) et sera utilis pour : Dfinir des ontologies en RDF, cest--dire exprimer en RDF les concepts spcifiques aux donnes bibliographiques (les attributs FRBR par exemple) Inclure les concepts gnriques applicables aux donnes bibliographiques Dfinir des modles de donnes en RDF