Fábio Mascarenhas e [email protected]
04outubro2007
Universidade Federal de PernambucoCentro de Artes e Comunicação
Departamento de Ciência da Informação
Tópicos Especiais em TI 2
http://toti2.wordpress.com
Assunto de hojeBases de dados
Na próxima aula entregar um ensaio sobre Bases de Dados!- Uma página tamanho A4, Fonte Arial 12, Espaçamento simples.
Aula 04out2007
• Em sentido amplo, as Bases de Dados são produtos resultantes de dados estruturados (organizados) armazenados em meios específicos.• Uma coleção de registros similares entre si e que contém determinadas relações entre esses registros. • Qualquer coleção de informações agrupadas segundo um interesse comum e mantidas eletronicamente (em computadores.• Fontes de informação automatizada que podem ser pesquisadas de diversos modos.
Aula 04out2007
EVOLUÇÃO1951 - Bases de dados numéricos 1960 - Bases de dados bibliográficos 1970 - 10 Bases disponíveis (acesso online) 1986 - Bases em suporte de CD-ROM 1990 - 3.200 Bases hospedadas 2000 - Milhões de computadores ligados em rede.
Aula 04out2007
Aula 04out2007
CRIAÇÃO/ALIMENTAÇÃO
USO
Aula 04out2007
USO
CLASSIFICAÇÃO DAS BASES DE DADOS
Bases de dados referenciaisremetem às fontes primáriasBases de dados de fontescontém os dados originais e textos completos; constituem um tipo de documento eletrônico.
Aula 04out2007
REFERENCIAIS
• Bibliográficas - Incluem citações bibliográficas acompanhadas ou não dos resumos dos trabalhos publicados. Ex.: LICI/IBICT; MEDLINE; ERIC • Catalográficas - Representam o acervo de uma biblioteca ou de uma rede de bibliotecas, sem indicação do conteúdo dos documentos. Ex.: UNIBIBLI; OPACS (Online Public Access Catalogs) • Diretórios - informações ou dados sobre pessoas, instituições e outros dados característicos de guias e cadastros.Ex.: Plataforma Lattes, Diretório de Grupos de Pesquisa
CLASSIFICAÇÃO DAS BASES DE DADOS
Bases de dados referenciaisremetem às fontes primáriasBases de dados de fontescontém os dados originais e textos completos; constituem um tipo de documento eletrônico.
Aula 04out2007
FONTESContém os dados originais e textos completos; constituem um tipo de documento eletrônico.• Numéricos - Incluem dados numéricos e estatísticos. Ex.: SIDRA/Fundação IBGE •Texto Completo - contém notícias de jornal, especificações técnicas, artigos de periódicos, dicionários. •Ex.: Portal da pesquisa•Textuais e Numéricos - mistura de dados textuais e numéricos. Ex.: Relatórios Anuais de Empresas.• Gráficos - apresentam fórmulas químicas, imagens, logotipos. Ex.: INPI (marcas comerciais)
Aula 04out2007
TIPOS MÍDIA CARACTERÍSTICAS
Cadastros; Abstracts; Index; Diretórios; Anuários; Bibliografias; Balanços; Pesquisas.
Produtos desenvolvidos e impressos em papel.
Falta normalização e padrões; pouca cooperação entre instituições; difícil distribuição; Alto custo; Demora no acesso.
Cadastros; Abstracts; Index; Diretórios; Anuários; Bibliografias; Balanços; Pesquisas.
Produtos desenvolvidos e impressos em papel;cooperação via fitas magnéticas.
Início de normalização e padrões e cooperações; Melhor distribuição e acesso; Alto custo.
Bases de dados eletrônicas do tipo: Bibliográficas; Referenciais; Cadastrais; Numéricas.
Algumas bases são impressas e eletrônicas, outras apenas eletrônicas; cooperação online.
Normalização e padrões internacionais; Cooperação institucional; Alto custo na impressão e telecomunicação.
TRAJETÓRIA
Aula 04out2007
TIPOS MÍDIA CARACTERÍSTICAS
Bases de dados eletrônicas e óticas do tipo: Bibliográficas; Referenciais; Cadastrais; Numéricas.
Algumas bases são impressas e eletrônicas, outras apenas eletrônicas e algumas em formato ótico.Cooperação online.
Normalização e padrões internacionais; Cooperação institucional; Alto custo na impressão e telecomunicação e baixo custo no ótico.Acesso em tempo real.
Bases de dados eletrônicas e óticas do tipo: Bibliográficas; Referenciais; Cadastrais; Numéricas; Fontes (texto completo.
Bases impressas, eletrônicas, em formato ótico, e via Internet; Modelos de metadados.
Normalização e padrões internacionais; Cooperação institucional; Baixo custo em formato ótico e Internet subsidiado.
TRAJETÓRIA
RECUPERAÇÃO DA INFORMAÇÃO EM BASE DE DADOS
Linguagem de busca: controlada, natural, livre Lógica de busca (booleana): combinação de termos enunciados com operadores: AND, OR, NOT.. Passos da recuperação: definir os termos; relacionar os termos; mostrar estratégias Recursos de recuperação: básicos (help, janelas, comandos); seleção de termos de busca (índice de palavras); entrada de termos de busca (vocabulário controlado); combinação de termos; escolha de campos; truncamentos; expressões de proximidade; limitações de amplitude; opções avançadas de exibição (texto completo); busca de múltiplos arquivos; exibição de tesauro; hipertextos (links com outros registros).
Aula 04out2007
É IMPORTANTE PARA UMA BASE..Não ser redundante, ou seja, possuir o mínimo de duplicidade de dados idênticos, de preferência nenhuma. Essa duplicidade dificulta o mantenimento da consistência de dados e acarreta desperdício de espaço no armazenamento.Ser independente de determinado software, de modo que os dados possam ser transferidos ou reestruturados sem a necessidade de fazer alterações radicais nos programas;Incluir o maior número possível de inter-relações de dados;Possuir um método comum de recuperação, inserção e correção de dados.
Aula 04out2007
Aula 04out2007
CRIAÇÃO/MANUTENÇÃO
O sucesso das Bases de Dados se deve em parte à adoção de padrões (protocolos) de comunicação e organização de dados em sistemas de gerenciamento de informações. O Z39.50 e SR são normas relativas a recuperação da informação, sendo a primeira um protocolo nacional norte-americano desenvolvido pelo ANSI (American Nacional Standards Institute), enquanto a SR é internacional, oriunda da ISO(International Standards Organisation) por isso também chamada de ISO 10162/3.Ambas são compatíveis, mas a Z39.50 é utilizada com mais freqüência devido à sua maior funcionalidade. Vamos conhecê-la melhor.
Aula 04out2007
Z39.50• Permite a usuários de diferentes produtos de software se comunicarem entre si e intercambiar dados.• É utilizada em vários sistemas de gerenciamento de bibliotecas (inclusive recomendado pelo MEC) e nos serviços de buscas online oferecidos pelo Mead data Central, Dialog, SilverPlatter.
Aula 04out2007
Z39.50
Aula 04out2007
Mantido pela Library of Congress que trabalha de forma estreita com o ZIG (Z39.50 Internet Group), grupo de companhias e organizações que usam o protocolo em seus sistemas e aplicações.
Define uma forma de comunicação entre computadores em um ambiente cliente/servidor distribuído com o propósito de recuperação de informações.
Permite que a informação possa ser pesquisada e recuperada independentemente de qual servidor que opera a base de dados, qual o gerenciador de base de dados ou de qual programa de interface do cliente.
Aula 04out2007
O protocolo apenas descreve como a informação é intercambiada e organizada, deixando o resto com os implementadores;
Envolve um servidor (local onde estão armazenados os registros), uma ou mais bases de dados, e um cliente (a máquina do usuário).
Quando uma conexão é feita entre um cliente e um servidor, são trocadas algumas informações, relacionadas com tamanho de registro, número de versão, e características suportadas pelo sistema.
O servidor não está pronto para receber buscas do cliente. O usuário monta a expressão no formato nativo do programa cliente que a transforma no padrão do Z39.50, antes de enviá-la para o servidor.
Z39.50
Aula 04out2007
A expressão recebida pelo servidor é processada e o resultado é convertido no padrão Z39.50 antes de ser enviado para o cliente. O cliente mostra na tela o resultado ao usuário que, se desejar ver os registros, indica ao cliente um comando que será enviado ao servidor.
O servidor por sua vez envia as informações ao cliente no padrão definido pelo Z39.50.
Para que serve:- Possibilitar a criação de sistemas de busca multi-base- OPACs- Empréstimo entre Bibliotecas
Z39.50
METADADOS (dados que descrevem dados)
Antes havia a dificuldade para organizar e disseminar informações coletadas de diferentes fontes, por isso surgiu o Common Communication Format (CCF). Depois surgiram outros como o do UNISIST proposto pela UNESCO voltado a Informação Científica e Tecnológica. Atualmente os metadados se destacam na compatibilização de sistemas na Web.
Aula 04out2007
Entre algumas vantagens dos metadados destacam-se:Estabelecimento de padrões de dados diante da heterogeneidade de informações na rede;Facilidade e maior precisão na recuperação das informações desejadas;Troca de informações entre aplicações e entre organizações.
Aula 04out2007
METADADOS (dados que descrevem dados)
Vejamos dois formatos bem conhecidos:MARC – Um dos primeiros projetos de intercâmbio bibliográfico, era baseado na AACR e originou outros formatos, todos baseados na ISO 2709. O USMARC, desenvolvido pela Online CCOmputer Library Center’s (OCLC) direcionou-se mais a cooperação de dados via Internet.Dublin Core – Surgiu em 1995 e conta com boa aceitação mundial (inclui o Brasil) e no seu desenvolvimento, baseado no protocolo Z39.50, estabeleceram 15 elementos de descrição para metadados
Aula 04out2007
METADADOS (dados que descrevem dados)
Formato MARC Machine Readable Cataloguing Record
(registro catalográfico legível por computador)
LCMARC, USMARC, UKMARC, CanMARK Adota:
ISO2709 para estruturar o arquivo AACR2R para descrever dados
Aula 04out2007
Catalogação Cooperativa - união de bibliotecas que visa o aproveitamento dos registros de material bibliográfico para diminuir custos e tempo de processamento por meio da adoção de padrões de registro e intercâmbio de dados.
Aula 04out2007
Formato MARC
Catalogação Cooperativa
RegistroOriginal
Registro Copiado
Registro Copiado
Registro Copiado
Registro Copiado
Aula 04out2007
MARC - Uso
Catalogação Coletiva: Os catálogos coletivos indicam onde
existem exemplares de cada referência nos locais cobertos pelo catálogo.
Referências são transferidas das bases locais para base central.
Aula 04out2007
Catalogação Coletiva
RegistroCentral
Registro Local
Registro Local
Registro Local
Registro LocalProdutos
Coletivos
Aula 04out2007
Padrão Dublin-Core
ELEMENTOS DESCRITORES PARA CONTEÚDO Título
Nome dado ao documento Palavras-chave
Assuntos de que se trata o documento Descrição
Resumo do documento Tipo
Definir categoria como texto, imagem, som,... Fonte
Documento do qual o presente documento foi derivado
Cobertura Delimitação espacial ou temporal do recurso
Aula 04out2007
ELEMENTOS DESCRITORES PARA PROPRIEDADE INTELECTUAL Autor ou Criador
Pessoa ou instituição responsável pela criação do conteúdo intelectual do documento
Publicador Responsável pela publicação do documento na
presente forma Colaborador
Responsável por parte significativa do conteúdo Direitos autorais
Definição dos direitos de propriedade sobre o recurso
Aula 04out2007
Padrão Dublin-Core
ELEMENTOS DESCRITORES PARA INSTANCIAÇÃO DO DOCUMENTO Data
Data no qual o presente recurso se tornou disponível Identificador
Referência, código ou número que identifica o documento de forma única
Formato Formato do documento (ex.: doc, pdf,...)
Idioma Principal idioma do conteúdo do documento
Relação Documentos relacionados
Aula 04out2007
Padrão Dublin-Core
O que vem depois...
08 Práticas (No laboratório)11 Bibliotecas Digitais
15 Protocolos
18 Práticas (lab.)
22 Arquivos Abertos
25 WEB 2, Blogs
29 Práticas (lab)
OUTUBRO
Aula 01out2007