Upload
leticia-strehl
View
614
Download
0
Embed Size (px)
Citation preview
Funções e disfunções das bases de dados em levantamentos bibliométricos
Letícia StrehlBiblioteca Central
Universidade Federal do Rio Grande do Sul
Seminário “Citações: usos e limitações”, Rio de Janeiro, 23 de agosto de 2012.
Sumário
• Bases de dados e levantamentos bibliométricos– Componentes das bases de dados:
• cobertura• indexação• busca• resultado
– A produção e o impacto como dado:• autores• instituições• referências
Componentes das bases de dados
1. Cobertura: o conjunto de registros ou documentos (conjunto de documentos)
2. Indexação: o método de indexação ou acesso ao conjunto de documentos (método de acesso)
3. Busca: a verbalização desta necessidade em uma seqüência de expressões de busca (estratégia de busca)
4. Resultado: a seqüência dos itens apresentados como um resultado da estratégia de busca (conjunto de itens recuperados ou seqüência)
Quatro do 6 componentes enumerados por: TAGUE-SUTCLIFFE, J. M. Em: Some perspectives on the evaluation of information retrieval systems. Journal of the American Society for Information Science , v. 47, n. 1, p. 1-3, 1996.
Requisitos das bases de dados para estudos de produção e impacto
• Indexação de:– uma quantidade representativa de documentos
(cobertura);– identificação consiste de autores, instituições e as
referências citadas nas publicações.
Atualmente, as principais bases de dados para o cumprimento desta finalidade são a Web of Science (WoS), a Scopus e o Google Acadêmico (GA)
Componente das bases de dados (1)
COBERTURA
Definição da cobertura
• Identificação:– da produção ONDE– do impacto DO que NO que
Cobertura: O conjunto de registros ou documentos
– Número de registros:• Total• Por tipo de documento (artigos de revistas, trabalhos
em eventos, teses, livros, etc.) • Por tipo de fonte (instituições públicas e privadas,
associações nacionais e estrangeiras, etc.)• Por idioma• Por país responsável pela publicação das fontes
– Período de cobertura das fontes– Periodicidade de atualização
JACSO, P. Content evaluation of databases. Annual Review of Information Science and Technology, v. 32, p. 231-267, 1997.
Análise quantitativa da composição de bases de dados: um exemplo
Bustos-González, Atilio. Edición de revistas científicas con visibilidad ficas internacional: criterios para ser incluidos en bases de datos comprensivas. Apresentação realizada no "Seminário de Comunicação Científica, São Paulo, 13 de junho de 2008". ELSEVIER. About Scopus. 2011. THOMSON REUTERS. Web of Science. 2011.
Periódicos arbitrados ≈30 mil
Scopus≈18 mil
Web os Science≈10 mil
A importância da cobertura retrospectiva
LARIVIERE, V.; ARCHAMBAULT, E.; GINGRAS, Y. Long-term patterns in the aging of the scientific literature, 1900–2004. 2007. Trabalho apresentado no 11th International Conference on Scientometrics and Informetrics, 2007, Madrid.
WoS:1945-, 1956- e 1975---Scopus:1996--GA?????
A cobertura:seletiva versus exaustivabom e ruim em ambas
O seletivo bom e o seletivo ruim
Produção em periódicos que adotam criteriosa avaliação por pares
Destes, apenas os que tratam de interesse internacional
A competição instaurada em 2005 entre WoS e Scopus alterou o quadro em 2009.
Todavia, a busca retrospectiva continua um problema.
A cobertura:seletiva versus exaustivabom e ruim em ambas
O exaustivo bom e o exaustivo ruim
Produção em periódicos que adotam criteriosa avaliação por pares
Produção em periódicos que adotam duvidosa avaliação por pares
da produção ONDEdo impacto DO que NO que
?
Componente das bases de dados (2)
INDEXAÇÃO
Indexação• A forma de representação que dá acesso ao
conjunto de dados• Recursos cada vez mais sofisticados
• Todavia, em regra, os dados tem a qualidade limitada à própria informação dada pelos autores
A qualidade dos dados e a precisão das informações dos próprios autores
Autor Instituição
Referência
A precisa identificação dos autores e instituições: recursos atenuantes (1)
Researcher ID:o pesquisador reune consistentemente a informação sobre sua produção com dados da WoS
A precisa identificação dos autores e instituições: recursos atenuantes (2)
A precisa identificação dos autores e instituições: recursos atenuantes (3)
O usuário informa à base que os diferentes registros identificam um único autor ou instituição
A precisa identificação das referências:situações agravantes
Disponibilidade dos manuscritos nos repositórios sem identificação dos dados de publicação
Disponibilidade dos artigos nos sites publishers antes da publicação
A identificação do DOI nas referências é um
atenuante.
As inconsistências particulares do
Multiplicação de produção
1 em 4
Multiplicação de impacto
3 em 7
Autores?
• Autor fantasma: P Login ou seja Please Login (2.340 artigos)
• Autores perdidos
A precisa identificação da produção: recursos atenuantes
Perfil do pesquisador no GA:o pesquisador reune as diferentes versões que correspondem a uma única produção
Algumas ressalvas para o uso do Google Acadêmico
• Nem todos os periódicos importantes indexados pelas bases de dados tradicionais estão indexados pelo GA;
• as citação a documentos recentes são mais comuns no GA uma vez que documentos mais antigos estão disponíveis em menor quantidade na Web;
• algumas áreas estão melhor representadas por contarem tradicionalmente com repositórios mais antigos e exaustivos, um exemplo é a física como a pioneira base de pré-prints arXiv.org.
TODAS AS BASES POSSUEM INCONSISTÊNCIAS!TODO O LEVANTAMENTO BILIOMÉTRICO EXIGE LIMPEZA DE DADOS!
Todavia, para PeterJácso as inconsistências do GA são tantas que inviabilizam por completo o
uso dos dados para cálculo de índices bibliométricos
Mas, para a recuperação, o GA é uma excelente ferramenta
Jacsó, P. Google Scholar's Ghost Authors. Library Journal. 2009.
Componente das bases de dados (3)
BUSCA
A busca
• Limitação do universo de documentos a ser estudado por sua representação em expressões de busca
• As inconsistências na indexação requerem a realização de uma série buscas intermediárias para contemplar todas as diferentes formas de representação do objeto de estudo
Recursos das bases de dados para a reunião de registros dispersos pelas inconsistências
Depois de identificar “todas” as formas possíveis de representação:
use e abuse dos operadores booleanos, de proximidade e truncagem:o “help” das bases de dados será o seu único amigo
Um exemplo de expressão de busca para recuperar a produção da UFRGS
OG=(Univ Fed Rio Grande Sul OR UFRGS OR Federal University Rio Grande do Sul OR Fed Univ Rio Grande do Sul OR Fed Univ Rio Grande Sul OR Rio Grande do Sul Fed Univ OR Rio Grande Sul Fed Univ OR Agron Univ Fed Rio Grande do Sul OR Fed Univ RS OR Univ Fed Rio Grande do Sul OR Fdn Univ Fed Rio Grande Sul OR URFGS OR UFGRS OR Univ Fed Rio Do Sul OR Fed Univ Rio Grande Sul UFRGS OR Fdn Univ Fed Rio Grande Sul OR Fed Univ Hosp Rio Grande Sul OR Fed Univ Rio Grande Sul State OR Fed Univ Fed Rio Grande Sul OR IF UFRGS)
MUITO [email protected]