Datos vinculados bibliotecarios la web 3.0 en las bibliotecas

Preview:

Citation preview

Dr. Wilmer Arturo Moyano GrimaldoBiblioteca Nacional de Colombia

Datos abiertos y datos vinculados: las bibliotecas en la era de la Web Semántica

De que hablaremos…

• Lenguajes y transmisión de conocimiento

• Recuperación de información en la Web• La Web:

• Usuarios en la Web y su comportamiento

• y sus versiones… 1.0 - 2.0 - 3.0…• Web semántica (web de datos)

• Datos vinculados• Datos abiertos• Datos bibliográficos vinculados

Lenguaje

Lenguaje y conocimiento

KOS

Productor de conocimiento

Consumidor de conocimiento

¿Cómo se ve en la Web?

• Grandes organizaciones:₋ Producen y consumen (enfocadas a su línea de

trabajo)• Usuario de la Web

₋ Produce y consume (para cualquier cosa)

Adquirir

Encontrar Identificar

SeleccionarLos servicios Web más exitosos son aquellos que permiten agregar información que nos

interesa: Google, Facebook, entre otros

Usuario consumidor en la Web

El Problema de la organización, gestión y recuperación de información:

- Publicación de contenidos- Acceso a la información y

cambio constante de la información

- Integración de recursos distribuidos

- Categorización y valoración de contenidos

- Confianza o fiabilidad de los contenidos.

SOLUCIÓN tradicional:

La representación y recuperación de información en Internet

7

1. Ambigüedad en el significado de las cadenas de búsqueda

2. Multitud de resultados sin orden lógico (Google)

3. Imposible trasladar la relevancia subjetiva del usuario (incapacidad de entender el significado que el usuario tiene en mente)

4. No garantía de fiabilidad5. Falta ayuda para la formulación de las

búsquedas

¿Realmente son soluciones?

9

• Necesita visibilidad de sus contenidos/productos/servicios, y debería:₋ Reutilizar información de otros para potenciar

sus servicios₋ Compartir información de la manera más sencilla

posible, aunque no siempre estandarizada₋ Enlazar su información con posibles socios

estratégicos (redes de servicios)₋ Diversificar sus servicios y contenidos

Usuario productor en la Web

• Web 1.0: Web como portal de información– Información exclusiva

de pocos– Directorios de sitios

web útiles– Sin contexto, sin

interacción, sin escalabilidad

La evolución de la Web

• Web 2.0: Web como plataforma de información– Se centra en el compartir

contenidos– El usuario consumidor tiene

poder y es más libre– Enlaza contenidos por si

mismo y con sus propias herramientas

– No hay buena personalización, portabilidad ni interoperabilidad

(CC) Licensed 2007 Eboy

La evolución de la Web

• Web 3.0 (Web Semántica– Personalizable– Ubicuidad– Movilidad– Datos abiertos– Datos enlazados

¡Web de datos!

La evolución de la Web

• Semejante a un sistema de almacenamiento de ficheros

• Conformado principalmente por objetos digitales

• Documentos o sus partes (datos) enlazados

• Baja estructura de los objetos

• Diseñada para consumo humano y para su servicio

La Web actual es una Web de documentos donde la mayoría de los datos funcionan como islas semánticas

Tim Berners-Lee http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html

La Web de datos

• Es la forma en que la Web espera enlazar todo tipo de datos porque se encuentran diversificados

• Publicar bajo ciertos parámetros y estándares y también ligarlos para permitir la generación de contenidos enriquecidos (conocimiento).– Ser parte de la WEB, no solo publicar

para la Web (reutilización de contenidos)

– Colaboración• Una gran Base de datos

interconectados y consultables por una interfaz convencional (con HTML)

http://www.w3.org/2009/Talks/0204-ted-tbl/#%281%29

Datos vinculados (Linked data)

• Información relativa a cualquier cosa:– Lugares:

Granada (España) http://dbpedia.org/page/Granada

– Registros de autoridadesFederico García Lorca http://

id.loc.gov/authorities/names/n79034425.html

– Números de Clasificación861 Poesía española

http://dewey.info/class/861/2009-08/about.es

¿Qué se puede publicar con datos vinculados?

• Usar URIs como nombres para las cosas.

• Usar URIs HTTP, de modo que la gente pueda buscar y localizar esos nombres.

• Cuando alguien busque empleando un URI, proporcionar información útil, utilizando estándares (RDF, SPARQL).

• Incluir enlaces a otros URIs, para que se puedan descubrir y localizar más cosas.

¿Que se necesita?

• RDF (Resource Description Framework)

Sujeto Predicado Objeto

Federico García Lorca Es autor de Romancero Gitano

Recurso VALORTIPO DE

PROPIEDAD

¿En qué consiste?

• Vocabularios que describen (propiedades) o indican que tipo (Clases) de recursos estamos usando

Federico García Lorca es una PersonaRomancero gitano es una Obra

Ejemplo de vocabulario: Schema.org (Apodo, dirección física, etc.)

¿En qué consiste?

Recurso Tipo de Propiedad Valor

Federico García Lorca Nacido en Granada

Federico García Lorca Autor de Romancero Gitano

Recurso Tipo de Propiedad Valor

http://id.loc.gov/authorities/names/n79034425.html

foaf:birthPlace http://dbpedia.org/page/Granada

http://id.loc.gov/authorities/names/n79034425.html

frbr:isCreatorOf http://datos.bne.es/page/resource/bimo0000036030

Enlazado de datos

Archivo digital de El Espectador

Museo Nacional de Colombia

Biblioteca Nacional de ColombiaBib. Luis Ángel Arango

Título uniforme: [Cien años de Soledad Español]

Bib. Piloto de MedellínCo863,64 23

Cámara Colombiana del libro978-958-8774-06-0

Semantic Classification Search

Data.bnf.fr

Biblioteca Digital Mundial

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

Datos abiertos

Datos vinculados

Datos abiertos

vinculados

Aclaración de términos

InteroperabilidadR.D.F

DUBLIN CORE

• DC.Creator• DC.Description• DC.Date

ENCODED ARCHIVAL DESCRIPTION

• <author>• <notestmt><note>• <publicationstmt><date>

R.D.F

• Desarrollado por el Library Linked Data Incubator Group – Entre mayo y agosto

de 2011– Informe final:

Octubre de 2011

• Objetivo:“contribuir a incrementar la interoperabilidad global de los datos de las bibliotecas en la Web, reuniendo a personas implicadas en actividades de la Web Semántica —centradas en los Datos Vinculados— en bibliotecas e instituciones afines, mediante el examen de las iniciativas en curso e identificando futuras vías de colaboración” * http://www.larramendi.es/LAM/Incubator/lld/XGR-lld-20111025.html

29

Informe Final del Grupo Incubador de Datos Vinculados de Bibliotecas del W3C*

• Alcance del informe• Ventajas del enfoque

de Datos Vinculados• Situación actual• Recomendaciones• Referencias • Agradecimientos

• Apendices:A. Inventario de

recursos existentes de Datos Vinculados de bibliotecas

B. Tecnologías pertinentes

C. Alineamiento semántico

Partes del informe

• Para “Bibliotecas” = todo tipo de unidad de información (Bibliotecas, archivos y museos LAM)

• Datos de bibliotecas: información digital que permite describir y recuperar información en las bibliotecas

• Datos vinculados (Interoperabilidad técnica)• Datos abiertos (desde el aspecto legal)• Datos vinculados de bibliotecas (library linked data)

Para que las bibliotecas puedan compartir, extender y reutilizar sus recursos con otras bibliotecas

Conceptos

• Directores de bibliotecas• Organismos de

normalización de bibliotecas

• Ingenieros de datos y de sistemas

• Bibliotecarios y archiveros

¿A quién se dirige?

• Investigadores, los estudiantes y los usuarios

• Las organizaciones • Los bibliotecarios,

archiveros y conservadores de museos

• Desarrolladores y firmas comerciales

¿A quién beneficia?

• General– Creación y distribución de

datos• Colaboración, reutilización

de datos, economía en los procesos e incremento en el valor de los datos

– Descripciones de metadatos más accesibles

– Compartir parte de sus datos, no la totalidad de los mismos

– Reducción de descripciones

• Específicos– Investigadores, los

estudiantes y los usuarios. (Centralización, mejor navegación, investigación multidisciplinar)

– Las organizaciones (mejor tratamiento de datos, desarrollo de Servicios)

– Los bibliotecarios, archiveros y conservadores de museos. (Colaboración)

– Desarrolladores y firmas comerciales (Uso de formatos abiertos, creación de productos y herramientas nuevas)

¿Cómo beneficia?

• Los datos de las bibliotecas no están integrados con los recursos Web

• Las normas de las bibliotecas están diseñadas únicamente para la comunidad bibliotecaria

• La comunidad bibliotecaria y la comunidad de la Web Semántica utilizan una terminología diferente para conceptos similares sobre metadatos

• Los cambios tecnológicos en las bibliotecas dependen del desarrollo de sistemas comerciales

¿Están preparadas las bibliotecas?

Propiedad de los derechos de autor

Algunas bibliotecas tienen un uso restringido de sus datosDepende mucho de la legislación del paísPresencia de pocos registros originalmente desarrollados por las bibliotecasCatalogación cooperativa

Derechos de autor como negocio para las organizaciones

Algunas agencias tienen su negocio en la creación de

registrosNo publicación abiertaPublicación limitadaDatos vinculados pero no abiertos

¿Y los derechos de autor?

• Directores de bibliotecas: Identificación de datos• Organismos de normalización: desarrollo de

normas y estandarización de bibliotecas• Ingenieros de datos y de sistemas: diseño de

servicios basados en Datos Vinculados• Bibliotecarios y archiveros: preservar los

conjuntos de elementos y los vocabularios de valores de Datos Vinculados, a través de la experiencia profesional.

Recomendaciones

• No hay iniciativas desde ninguna biblioteca– Desconocimiento del tema– Estrategias de Gobierno en

Línea • Guía para datos abiertos en

Colombia (2011)• Datos abiertos de gobierno

electrónicohttp://datosabiertoscolombia.cloudapp.net/frm/buscador/frmBuscador.aspx

– Biblioteca Nacional de Colombia

¿Y en Colombia?

Gracias

Preguntas:

wmoyano@mincultura.gov.co

Recommended