An approach for managing and semantically enriching the publication of Linked Open Governmental Data Kelli de Faria Cordeiro 1, Fabricio Firmino de Faria

  • View
    102

  • Download
    0

Embed Size (px)

Transcript

  • Slide 1
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Kelli de Faria Cordeiro 1, Fabricio Firmino de Faria 1, Bianca de Oliveira Pereira 1,2, Andr Freitas 2, Cristiano Expedito Ribeiro 1, Joo Vitor Villas Boas Freitas 1, Ana Christina Bringuente 3, Lucas de Oliveira Arantes 3, Rodrigo Calhau 3, Veruska Zamborlini 3, Maria Luiza Machado Campos 1, Giancarlo Guizzardi 3 1 Graduate Program in Informatics (PPGI) Federal University of Rio de Janeiro (UFRJ) Brazil 2 Digital Enterprise Research Institute (DERI) National University of Ireland Galway Ireland 3 Ontology and Conceptual Modeling Research Group (NEMO) Computer Science Department Federal University of Esprito Santo (UFES) Brazil
  • Slide 2
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Agenda Motivao e contextualizao Cenrio Atual em Dados Abertos Interligados (LOD) Projeto LinkedDataBR ETL Workflow Tratamento Semntico Incremental Estudo de Caso Consideraes finais 2
  • Slide 3
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Motivao e contextualizao 3
  • Slide 4
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Esto abertos? 4 Motivao e contextualizao
  • Slide 5
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data 5 CAPES CNPq RNP Uso conjunto ainda um desafio! Uso conjunto ainda um desafio! Motivao e contextualizao
  • Slide 6
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Interoperabilidade e Integrao de dados na Web ainda requerem considervel esforo Mesmo dentro de uma organizao!. Tivemos SGBD por mais de meio sculo, mas conseguimos a integrao que se pretendia? O que faltou ? E agora, na Web: Distribudos, heterogneos, em grande escala, altamente visveis, grande nmero de diferentes usurios, 6 Motivao e contextualizao
  • Slide 7
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Linked Open Data (LOD) LOD pode ser considerado uma abordagem mais simplista de uso de tecnologias da Web Semntica Baseada em triplas (RDF) para representar os dados de forma realmente granular Facilita a interligao Acompanhado de um descritor Abordagem pay-as-you-go 7
  • Slide 8
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Linked Open Data (LOD) O que vem a ser Dados Abertos Interligados? Utilizao ampla de padres Representao de dados em um gro mnimo (triplas RDF) Flexibilidade nas ligaes entre itens de dados Tem a interoperabilidade em sua essncia RDF: Resource DESCRIPTION Framework Criado para interoperar METADADOS! Descritores esto na base da proposta 8
  • Slide 9
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Linked Open Data (LOD) Uma maneira nova de publicar e consumir dados! O poder das ligaes tipadas O poder da colaborao Consumidores podem ser publicadores tambm! Mais e mais dados sendo gerados e potencialmente ligveis Sensores e Web das Coisas Dados e metadados sendo explorados juntos em novas aplicaes Consulta E Navegao E Busca! 9
  • Slide 10
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Dados publicados como LOD At quando conseguiremos representar esta nuvem? 10 265 datasets - 32 bilhes de triplas - 42% de dados de governo Setembro de 2011
  • Slide 11
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Cenrio Atual - Internacional Muitas iniciativas de governo Governo Britnico, Estados Unidos, Espanha, etc. Diferentes abordagens Entrando em fase mais madura Muitas iniciativas do setor privado BBC, New York Times,... Muitas iniciativas em e-Cincia Dados genmicos, dados de meio-ambiente,... Forte envolvimento da rea acadmica Consrcio W3C, Sir Tim Berners Lee (MIT) DERI/NUI (Irlanda), Univ. Berlim (Alemanha), Univ. de Madri (Espanha) Projeto LOD2 11
  • Slide 12
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Cenrio Atual - Internacional Grande diversidade de ferramentas Ainda sendo experimentadas Foco em atividades especficas de publicao, consumo e colaborao Ainda razovel esforo requerido para seu uso conjunto Abordagem liberal Prioridade para expor os dados e depois ir complementando sua descrio Uso de ontologias ainda incipiente Processo de publicao muito artesanal Qualidade do dado publicado ainda pouco rastrevel Entrando em fase de amadurecimento Maior preocupao com semntica e descritores Frameworks para integrao de ferramentas sendo discutidos 12
  • Slide 13
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Cenrio Atual - Nacional Inicialmente evoluindo sobre pesquisas e aplicaes da Web Semntica e Ontologias PUC-RJ, UFRJ, UFES, PUC-RJ, PUC-RS, Interesse crescente no Governo: Inicialmente uma certa confuso com dados abertos Acordo assinado entre o Brasil, EUA e mais 6 pases Tema do CONSEGI deste ano Ministrio do Planejamento : Cria o INDA Infraestrutura Nacional de Dados Abertos Baseada em LOD e uso de ontologias Apoio do W3C Brasil e CGI/BR Cria o GT Ontologias Iniciativas experimentais em LOD Experimentos pontuais -> simples converso de dados e interfaces atraentes Tecnologia ainda pouco conhecida 13
  • Slide 14
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data LinkedDataBR
  • Slide 15
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Nossa Abordagem Alguns domnios requerem uma abordagem sistemtica que garanta: Maior controle do processo Manuteno da consistncia dos dados sendo publicados Este o caso de: Dados Governamentais Dados de e-Cincia Necessrio adotar uma abordagem de gesto de dados 15
  • Slide 16
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data LinkedDataBR - FOCO Foco no apoio ao processo de publicao na qualidade do dado Caracterstica da soluo : Plataforma integrada e flexvel Maximizao no reuso de ferramentas existentes (software livre) Explorar: Gerncia de metadados Apoio ao processo com ferramenta de workflow (ETL) Tratamento Semntico
  • Slide 17
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data LinkedDataBR - FOCO 17 Treatment Process Triples Vocabulary Ontology Repository LinkedDataBR Feed/Expose Requests URI Responses Linked Data Queries Consume/Explore Consumers Data Producers Governmental and Non Governmental Entities Universities and Research Institutes Governmental and Non Governmental Entities Universities and Research Institutes Citizen and Private Companies LinkedDataCloud Provenance
  • Slide 18
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Projeto LinkedDataBR Objetivos Construo de uma infra-estrutura inicial de suporte publicao e criao de repositrios de dados abertos utilizando os padres de Linked Data E ainda: Criao de diretrizes associadas ao processo de publicao Criao de grupo de interesse e mobilizao para apoio e estmulo iniciativa de Linked Open Data no Brasil e sua insero no cenrio mundial de dados abertos interligados. 18
  • Slide 19
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Projeto LinkedDataBR Arquitetura 19
  • Slide 20
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data ETL Workflow (Captura de Provenincia) 20 Publishing Workflow Process Triplify Linking Retrospective Provenance Data Prospective Provenance Data Workflow Implementation Design Workflow Implementation Execution Extract Transform Load Triples Stage Linked Open Government Data Provenance Triples Raw Government Data
  • Slide 21
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data 21 ABORDAGENS PARA O ENRIQUECIMENTO SEMNTICO Publicao de Dados Abertos Ligados 21
  • Slide 22
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Ausncia de preocupao com a semntica 22
  • Slide 23
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Alguma preocupao com a semntica 23
  • Slide 24
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Preocupao mediana com a semntica 24
  • Slide 25
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data Muita preocupao com a semntica 25
  • Slide 26
  • An approach for managing and semantically enriching the publication of Linked Open Governmental Data 26 Exemplo de Cenrio de Publicao de Dados Interligados
  • Slide 27
  • Cenrio de Financiamentos de Projetos de Pesquisa Instituies de Pesquis