Fundamentos da Representação de Informações em Computadores
Prof. Carlos H. Marcondes
Representação e magia
Pinturas pré-históricas, grutas de Altamira (Espanha) e Lascaux (França)
Caracter instrumental da representação
• Manipula-se a representação por que é mais econômico que manipular a realidade diretamente
• O resultado da manipulação da representação é subsídio para a praxis sobre a realidade
• Similaridade: Representação e Realidade
Manipulação = Simulaçãocomputador é a máquina capaz de simular a realidade
Representação de conceitos
Carro
Representação de conceitos no computador
Carro
Realidade Representação computacional
Objeto, conceito
Representação simbólica (codificação, linguagem)
Representação por imagens
• Representação por IMAGENS – formatos “mapa-de-bits” (bitmap): .BMP, .PCX, .GIF, .TIFF, .JPEG
• Representação simbólica – uso da linguagem, caracteres são CODIFICADOS – códigos ASCII e EBCDIC– Cada caracter é representado por um código
de 8 bits
Representação de informações no computador
Possibilidades de codificação de informações em função do conjunto de sinais
- 1 bit : 0 - 21=2
1
- 2 bits: 00 - 22=4
10
01
11
00
- 3 bits: 000 - 23=8
100
010
001
110
101
011
111
000
Caracteres codificados permitem a busca por um padrão de bits ligados e desligados
A palavra “BRASIL”
01000010-01010010-01000001-01010011-01001001-01001100
B R A S I L
FORMATOS para representação de informações
• Um FORMATO é um específico arranjo de informações, formando um arquivo digital
• Um FORMATO contém informações voltadas para pessoas (conteúdo) e informações voltadas para os programas que processam estes conteúdos
• Ex: formato WINWORD (.DOC)– Conteúdo – - o caráter “A”– Informações para o programa - tipo de fonte
- cor- normal, negrito ou itálico- etc, etc, etc
Formatos proprietários – exclusivos de um fabricante. Ex: .DOC, PDF
Formatos abertos - padronizados. Ex. HTML, XML, JPEG, GIF
X
Tabela ASCII
#NJoão da Silva#EPetrobras#[email protected]###NMaria da Conceição#EBanco do Brasil#[email protected]##
João da Silva, Petrobras e [email protected] são os Conteúdos,
#N, #E, #M e ## são o Informações de codificação dos elementos do Vocabulário , de modo que minha mala direta possa ser comprendida por um programa
Arquivos em formato “mapa de bits”:
•
Arquivos em formato “mapa de bits”: como reconhecer um caracter?
A a A a A a a
a A ? ? ? ? ?
Processo de digitalização
A digitalização é o processo de transformar documentos em papel em arquivos digitais de imagem tipo ¨mapa-de-bits¨
Nos arquivos de imagem tipo “mapa-de-bits” cada ponto de um documento, cada ponto de cada caracter de um documento é desenhado e não representado por um código como no conjunto de caracteres ASCII
Processo de digitalizaçãoImagens são formadas por pontos
Pixel - (Picture Element) É o menor ponto de luz cuja cor e luminosidade podem ser controladas na tela. As imagens são formadas com a combinação de grande número de pixels. O termo é usado para referir-se a resolução de uma placa de vídeo ou monitor (ex: 800 x 600 pixels).
Pixels são representados por 1 ou mais “bits”
Bitonal ou preto-e-branco: 1 bit por pixel:
pontos pretos: “1”pontos brancos: “0”
Monocromático: preto-e-branco com diversas intensidades – 4 bits, 6 bits, 8 bits, por pixel)Colorido
8 bits por pixel: 256 cores12 bits por pixel : 4096 cores24 bits por pixel : 16.800.000 cores (“true color”)
0000000000 0000000000 0000000000 0111111110 0100000010 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0100000000 0000000000 0000000000 0000000000 0000000000
Arquivo “mapa-de-bits”
Imagem na Tela 10 X 20
Correspondência Arquivo “mapa-de-bits”, imagem na tela do computador
Processo de digitalização - RESOLUÇÃO
• Relação entre número de pontos de uma imagem (Pixels) / Área
• Unidade: “dpi” (“dots per inch”) pontos por polegada quadrada
• A resolução é uma medida da LEGIBILIDADE de uma imagem
Processo de digitalização - RESOLUÇÃO
• Corresponde à capacidade de detalhamento de uma imagem, quanto maior a resolução da imagem, maior será a sua capacidade de exibir detalhes.
Processo de digitalizaçãoRESOLUÇÃO - aplicação da digitalização em
DOCUMENTOS
Arquivos de imagens ( de documentos) com baixa resolução são POUCO LEGÍVEIS (abaixo de 50 dpi)
Acima de 800 dpi a vista humana NÃO DISTINGUE MAIS MELHORAS DE LEGIBILIDADE
Quanto maior a resolução de uma imagem, maior o tamanho do arquivo que vai armazena-la
Resolução razoável para documentos: 300 dbi
Processo de digitalização
• Como não existe um código único para cada caracter, as imagens dos caracteres são desenhadas!
A a A a A a a a A a,
• nos arquivos “mapa-de-bits” não é possível fazer busca por conteúdo
Processo de digitalização• Os sistemas de gerenciamento de imagens
eletrônicas de documentos – GED - associam a cada arquivo de imagem, um registro de uma base de dados com conteúdos textuais codificados, para fins de busca.
• Estes sistemas são a combinação das tecnologias de bancos de dados com a digitalização de documentos através do uso de escaners
Tipo | Num. | Setor | Data | Assunto |
Registro de um banco de dados: pontos de acesso para
recuperação
Imagem digitalizada de um documento