16
PLATAFORMA SEMÂNTICA DE RECUPERAÇÃO DA INFORMAÇÃO APLICADA A EXTRAÇÃO DE ARTIGOS CIENTÍFICOS Caio Saraiva Coneglian [email protected] Prof. Dr. Elvis Fusco [email protected]

Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

Embed Size (px)

Citation preview

Page 1: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

PLATAFORMA SEMÂNTICA DE RECUPERAÇÃO DA

INFORMAÇÃO APLICADA A EXTRAÇÃO DE ARTIGOS

CIENTÍFICOSCaio Saraiva Coneglian

[email protected]

Prof. Dr. Elvis Fusco

[email protected]

Page 2: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

Contextualização

Sistemas de Informação de Recuperação atuais são incapazes de recuperar informações de uma forma adequada no contexto de ambientes informacionais digitais tendo a Web como plataforma (Big Data).

Os ambientes computacionais de informação atendem plenamente as necessidades informacionais dos usuários?

Page 3: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

Objetivo

Criar um agente de busca semântica na WEB que permita: Localização; Tratamento e Recuperação da Informação.

Domínio da busca por documentos bibliográficos de pesquisas, de modo a proporcionar a intersecção entre os metadados de publicações científicas e as necessidades informacionais dos usuários, proposto por Fusco (2010).

Page 4: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

Metodologia

Levantamento de requisitos informacionais para acesso às pesquisas científicas;

Definição da metodologia de construção de ontologias;

Modelagem da ontologia de aplicação; Implementação do protótipo do agente

semântico de recuperação de informações baseado em conceitos semânticos;

Análise dos resultados de recuperação do protótipo (prova de conceito).

Page 5: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

Plataforma

Figura 1: Arquitetura de Contextualização do Agente Semântico de Extração

Page 6: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

Modelo de Extração

Figura 2: Modelo de extração do agente semântico

Page 7: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

Ontologia

Segundo Clark (1999), uma ontologia é organizada em hierarquias de conceitos;

E utilizando a classificação de Gomes-Perez (1999), a ontologia do projeto é uma Ontologia de Aplicação, que busca solucionar um problema específico de um domínio.

Page 8: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

Implementação Ontologia

Para realizar a implementação da ontologia, foi seguido o modelo proposto por Noy (2001), em que são realizados 7 passos na construção de ontologias;

Como domínio para a construção desta ontologia, foi utilizada busca de publicações científicas na base de dados IEEE;

Foi utilizado o programa Protégé para realizar a implementação da ontologia.

Page 9: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

Implementação Ontologia

Figura 3: Diagrama da Ontologia

Page 10: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

Implementação do Agente

O robô de busca extrai os metadados de artigos da página do IEEE Xplore (http://ieeexplore.ieee.org).

Após a extração, é realizada a análise dos metadados baseados nos conceitos descritos na ontologia.

Page 11: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

Lógica de Extração

Figura 4: Lógica de Extração do Robô de Busca

Page 12: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

Testes Para a realização dos testes, foram

realizadas buscas de publicações na área de banco de dados. Por exemplo: publicações sobre datawarehouse;

Neste exemplo, o SRI do IEEE recupera 25 artigos, porém apenas 7 são retornados pela busca semântica, pois são os de fato aderentes à necessidade informacional do usuário.

Figura 5: Relações da classe do termo pesquisado

Page 13: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

Testes

Figura 6: Resultado de uma busca, pesquisando o termo “Datawarehouse”

Page 14: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

Resultados

O uso de ontologias permite estender o processo de Recuperação da Informação com a utilização de conceitos semânticos;

Os resultados obtidos por este agente proporcionam uma maior intersecção entre os documentos e as necessidades informacionais dos usuários;

Demonstrou-se uma alternativa prática de implementação da Web Semântica no processo de Recuperação da Informação.

Page 15: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

Referências Bibliográficas

Clark, D. Mad cows, metathesaurim and meaning, IEEE Intelligent Systems. 1999.

Fusco, E. Modelos conceituais de dados como parte do processo da catalogação: perspectiva de uso dos FRBR no desenvolvimento de catálogos bibliográficos digitais. 2012.

Gómez-Pérez, A. Ontological engineering A state of the art. Expert Update: Knowledge Based Systems and Applied Artificial Intelligence 2.3. 33-43. 1999.

Noy, N. F. et al. Creating Semantic Web Contents with Protégé-2000. IEEE. 2001.

Page 16: Plataforma Semântica de Recuperação da Informação Aplicada a Extração de Artigos Científicos

PLATAFORMA SEMÂNTICA DE RECUPERAÇÃO DA

INFORMAÇÃO APLICADA A EXTRAÇÃO DE ARTIGOS

CIENTÍFICOSCaio Saraiva Coneglian

[email protected]

Prof. Dr. Elvis Fusco

[email protected]