An approach for managing and semantically enriching the publication of Linked Open Governmental Data

  • View
    533

  • Download
    1

Embed Size (px)

DESCRIPTION

With the growth of e-government programs, the available data to citizens is growing in volume every day. However, to make these data a useful source of information, to be referenced and integrated more easily by different applications, they should be published according to the best practices of Linked Open Data, using standards for description (RDF) and identification (URI) of data resources on the web. The main goal of this work is to propose aplatform and approach to support the exposure, sharing and association of data resources in the form of Linked Open Data, offering a user-friendly environment to stimulate the publication of data and their association to other existing data. Central functionalities to be included are data cleaning, transformation, linking, annotation and referencing to terminology mechanisms. http://andrefreitas.org/papers/SBBD-Workshop-eGov-preprint.pdfKelli de Faria Cordeiro, Fabricio Firmino de Faria, Bianca de Oliveira Pereira, Andr Freitas, Joo Vitor Villas Boas Freitas, Ana Christina Bringuente, Lucas de Oliveira Arantes, Rodrigo Calhau, Veruska Zamborlini, Maria Luiza Machado Campos, Giancarlo Guizzardi, An Approach for Managing and Semantically Enriching the Publication of Linked Open Governmental Data, 3rd Workshop of Applied Computing in Electronic Government (WCGE), In WEBMEDIA/SBBD, 2011

Transcript

  • An approach for managing and semantically enriching the publication

    of Linked Open Governmental Data

    Kelli de Faria Cordeiro1, Fabricio Firmino de Faria1, Bianca de Oliveira Pereira1,2, Andr Freitas2, Cristiano Expedito Ribeiro1, Joo Vitor Villas Boas Freitas1, Ana Christina

    Bringuente3, Lucas de Oliveira Arantes3, Rodrigo Calhau3, Veruska Zamborlini3, Maria Luiza Machado Campos1, Giancarlo Guizzardi3

    1Graduate Program in Informatics (PPGI) Federal University of Rio de Janeiro (UFRJ) Brazil

    2Digital Enterprise Research Institute (DERI) National University of Ireland Galway Ireland

    3Ontology and Conceptual Modeling Research Group (NEMO) Computer Science Department Federal University of Esprito Santo (UFES) Brazil

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    Agenda

    Motivao e contextualizao

    Cenrio Atual em Dados Abertos Interligados (LOD)

    Projeto LinkedDataBR

    ETL Workflow

    Tratamento Semntico Incremental

    Estudo de Caso

    Consideraes finais

    2

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    Motivao e contextualizao

    3

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    Esto abertos?

    4

    Motivao e contextualizao

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data 5

    CAPES

    CNPq

    RNP

    Uso conjunto ainda um desafio!

    Motivao e contextualizao

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    Interoperabilidade e Integrao de dados na Web ainda requerem considervel esforo

    Mesmo dentro de uma organizao!

    . Tivemos SGBD por mais de meio sculo, mas conseguimos a integrao que se pretendia? O que faltou ?

    E agora, na Web: Distribudos, heterogneos, em grande escala, altamente

    visveis, grande nmero de diferentes usurios,

    6

    Motivao e contextualizao

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    Linked Open Data (LOD)

    LOD pode ser considerado uma abordagem mais simplista de uso de tecnologias da Web Semntica

    Baseada em triplas (RDF) para representar os dados de forma realmente granular

    Facilita a interligao

    Acompanhado de um descritor

    Abordagem pay-as-you-go

    7

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    Linked Open Data (LOD)

    O que vem a ser Dados Abertos Interligados? Utilizao ampla de padres

    Representao de dados em um gro mnimo (triplas RDF)

    Flexibilidade nas ligaes entre itens de dados

    Tem a interoperabilidade em sua essncia

    RDF: Resource DESCRIPTION Framework

    Criado para interoperar METADADOS!

    Descritores esto na base da proposta

    8

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    Linked Open Data (LOD)

    Uma maneira nova de publicar e consumir dados! O poder das ligaes tipadas

    O poder da colaborao Consumidores podem ser publicadores tambm!

    Mais e mais dados sendo gerados e potencialmente ligveis Sensores e Web das Coisas

    Dados e metadados sendo explorados juntos em novas aplicaes

    Consulta E Navegao E Busca!

    9

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    Dados publicados como LOD

    At quando conseguiremos representar esta nuvem? 10

    265 datasets - 32 bilhes de triplas - 42% de dados de governo Setembro de 2011

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    Cenrio Atual - Internacional

    Muitas iniciativas de governo

    Governo Britnico, Estados Unidos, Espanha, etc.

    Diferentes abordagens

    Entrando em fase mais madura

    Muitas iniciativas do setor privado BBC, New York Times, ...

    Muitas iniciativas em e-Cincia Dados genmicos, dados de meio-ambiente,...

    Forte envolvimento da rea acadmica Consrcio W3C, Sir Tim Berners Lee (MIT)

    DERI/NUI (Irlanda), Univ. Berlim (Alemanha), Univ. de Madri (Espanha)

    Projeto LOD2

    11

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    Cenrio Atual - Internacional

    Grande diversidade de ferramentas Ainda sendo experimentadas

    Foco em atividades especficas de publicao, consumo e colaborao

    Ainda razovel esforo requerido para seu uso conjunto

    Abordagem liberal Prioridade para expor os dados e depois ir complementando sua

    descrio

    Uso de ontologias ainda incipiente

    Processo de publicao muito artesanal

    Qualidade do dado publicado ainda pouco rastrevel

    Entrando em fase de amadurecimento Maior preocupao com semntica e descritores

    Frameworks para integrao de ferramentas sendo discutidos

    12

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    Cenrio Atual - Nacional

    Inicialmente evoluindo sobre pesquisas e aplicaes da Web Semntica e Ontologias

    PUC-RJ, UFRJ, UFES, PUC-RJ, PUC-RS,

    Interesse crescente no Governo:

    Inicialmente uma certa confuso com dados abertos

    Acordo assinado entre o Brasil, EUA e mais 6 pases

    Tema do CONSEGI deste ano

    Ministrio do Planejamento : Cria o INDA Infraestrutura Nacional de Dados Abertos

    Baseada em LOD e uso de ontologias

    Apoio do W3C Brasil e CGI/BR Cria o GT Ontologias

    Iniciativas experimentais em LOD Experimentos pontuais -> simples converso de dados e interfaces atraentes

    Tecnologia ainda pouco conhecida

    13

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    LinkedDataBR

    Linked

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    Nossa Abordagem

    Alguns domnios requerem uma abordagem sistemtica que garanta:

    Maior controle do processo

    Manuteno da consistncia dos dados sendo publicados

    Este o caso de:

    Dados Governamentais

    Dados de e-Cincia

    Necessrio adotar uma abordagem de gesto de dados

    15

    Linked

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    LinkedDataBR - FOCO

    Foco no apoio ao processo de publicao

    na qualidade do dado

    Caracterstica da soluo: Plataforma integrada e flexvel

    Maximizao no reuso de ferramentas existentes (software livre)

    Explorar: Gerncia de metadados

    Apoio ao processo com ferramenta de workflow (ETL)

    Tratamento Semntico

    Linked

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    LinkedDataBR - FOCO

    17

    Treatment Process

    Triples Vocabulary Ontology

    Pre-Processing Triplification Linking

    Repository

    LinkedDataBR Feed/Expose

    Requests

    URI

    Responses

    Linked Data

    Queries

    Consume/Explore

    Consumers Data Producers

    Governmental and Non Governmental Entities

    Universities and Research Institutes

    Governmental and Non Governmental Entities

    Universities and Research Institutes

    Citizen and Private Companies

    LinkedDataCloud

    Linked

    Provenance

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    Projeto LinkedDataBR

    Objetivos

    Construo de uma infra-estrutura inicial de suporte publicao e criao de repositrios de dados abertos utilizando os padres de Linked Data

    E ainda:

    Criao de diretrizes associadas ao processo de publicao

    Criao de grupo de interesse e mobilizao para apoio e estmulo iniciativa de Linked Open Data no Brasil e sua insero no cenrio mundial de dados abertos interligados.

    18

    Linked

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    Projeto LinkedDataBR

    Arquitetura

    19

    Linked

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    ETL Workflow (Captura de Provenincia)

    20

    Publishing Workflow Process

    Triplify Linking

    Retrospective Provenance Data

    Prospective Provenance Data

    Workflow Implementation Design

    Workflow Implementation Execution

    Extract Transform Load

    Triples

    Stage

    Linked Open Government Data

    Provenance Triples

    Raw Government Data

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data 21

    ABORDAGENS PARA O ENRIQUECIMENTO SEMNTICO

    Publicao de Dados Abertos Ligados

    21

  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data

    Ausncia de preocupao com a semntica

    22

  • An approach for manag