55
Introducción a la Informática Almacenamiento de datos

Clase 2 Almacenamiento de datos

Embed Size (px)

Citation preview

Introducción a la

InformáticaAlmacenamiento de datos

Las computadoras solo realizan

4 funciones básicas

• Recibir una entrada: aceptan información del mundo exterior.

• Procesar información: Realizan operaciones aritméticas o lógicas sobre la información.

• Procesar una salida: comunican información al mundo exterior.

• Almacenar información: Desplazan y mueven información en la memoria.

Cada sistema de computadora contiene componentes (partes físicas) especializadas en cada una de estas cuatro funciones:

Dispositivos de entrada Dispositivos de salida Un microprocesador, también llamado procesador o unidad central de procesamiento CPU (es el cerebro de la computadora)

La memoria y los dispositivos de almacenaje

Cada sistema de computadora contiene componentes (partes físicas) especializadas en cada una de estas cuatro funciones:

Dispositivos de entrada Dispositivos de salida Un microprocesador, también llamado procesador o unidad central de procesamiento CPU (es el cerebro de la computadora)

La memoria y los dispositivos de almacenaje

Para realizar la entrada, se utilizan dispositivos “de

entrada”

Entrada

En la CPU … el procesador realiza las acciones

solicitadas

Proceso

Almacenamiento

Y se muestran a través de dispositivos “de salida”.

Salida

La informaciónLa información es un conjunto de datos acerca de algún suceso, hecho o fenómeno, que organizados en un contexto determinado tienen su significado, cuyo propósito puede ser el de reducir la incertidumbre o incrementar el conocimiento acerca de algo.

“ La información permite resolver problemas y tomar decisiones, ya que su aprovechamiento racional es la base del conocimiento. “

¿Qué es lo que entiende la computadora?

¿Imágenes?

¿Comandos?

En realidad sólo entiende de unos y ceros…

En el mundo de las computadoras la información es digital: esto significa que está hecha de unidades contables, separadas (dígitos) de modo que pueden subdividirse.

Los bits y su almacenamiento

Dentro de las computadoras actuales, la información se codifica mediante patrones de 0s y 1s. Estos dígitos se denominan bits (abreviatura de binary digits, dígitos binarios). La mayoría de las veces asociamos a los bits con valores numéricos, en realidad se trata de símbolos cuyo significado depende de cada aplicación concreta. En ocasiones, los patrones de bits se usan para representar valores numéricos; en otros casos, representan caracteres de un alfabeto y signos de puntuación, a veces representan imágenes y otras sonidos.

Una computadora no entiende palabras, números, imágenes, notas musicales o letras del alfabeto; no puede procesar información sin dividirla en unidades más pequeñas, denominadas bits. Igual que un joven lector, una computadora no puede procesar información sin dividirla en unidades más pequeñas.Un bit es la unidad más pequeña de información que puede procesar una computadora y puede tener solo dos valores 0 ó 1. Código

BinarioEs un sistema que denota todos los números con combinaciones de 2 dígitos.Igual que el sistema numérico decimal el binario tiene reglas claras, coherentes para cada operación aritmética.

Por ello…

Operaciones booleanasPara entender cómo se almacenan y manipulan los bits individuales dentro de una computadora, se puede decir que el bit 0 representa el valor falso y que el bit 1 representa el valor verdadero, porque eso nos permite pensar en la manipulación de bits como si se tratara de la manipulación de valores verdadero/falso. Las funciones que permiten manipular valores verdadero/falso son las operaciones booleanas, en honor del matemático George Boole(1815–1864), que fue un pionero en el campo de las matemáticas conocido con el nombre de lógica.

Las personas que trabajaron las primeras computadoras tenían que utilizar la aritmética binaria. Pero actualmente los software convierten los números decimales en binarios y viceversa de manera automática.

Por ello el proceso de numeración binario de la computadora en la actualidad se oculta completamente al usuario.

Sistemas de numeración

Binario: base 2 (0-1)

Octal: base 8 (0-7)

Decimal: base 10 (0-9)

Hexadecimal: base 16 (0-F)

Conversión entre el Sistema Binario y el Sistema Decimal

Decimal a Binario:Se divide el número del sistema decimal entre 2, cuyo resultado entero se vuelve a dividir entre 2, y así sucesivamente. Ordenados los restos, del último al primero, éste será el número binario que buscamos.Ejemplo 1Transformar el número decimal 131 en binario. El método es muy simple:

•131 dividido entre 2 da 65 y el resto es igual a 1• 65 dividido entre 2 da 32 y el resto es igual a 1• 32 dividido entre 2 da 16 y el resto es igual a 0• 16 dividido entre 2 da 8 y el resto es igual a 0 • 8 dividido entre 2 da 4 y el resto es igual a 0• 4 dividido entre 2 da 2 y el resto es igual a 0• 2 dividido entre 2 da 1 y el resto es igual a 0• 1 dividido entre 2 da 0 y el resto es igual a 1

Ordenamos los restos, del último al primero que están en color Azul: 100000112

Representación de la información

mediante patrones de bitsASCII – ASCII extendido -

UNICODE

Representación de textosLa información en forma de texto se suele representar por medio de un código en el que se asigna un patrón determinado de bits a cada uno de los distintos símbolos que aparecen en el texto (como por ejemplo las letras del alfabeto y los signos de puntuación). El texto se representa entonces mediante una larga cadena de bits, en la que los sucesivos patrones representan los símbolos sucesivos del texto original.

En la década de 1940 y 1950, se diseñaron y utilizaron muchos de esos códigos con diferentes tipos de equipos, lo que generó una lógica proliferación de problemas de comunicación. Para aliviar esta situación, el instituto ANSI (American National Standards Institute, Instituto Nacional Estadounidense de Estandarización) adoptó el código ASCII (American Standard Code for Information Interchange, Código estándar americano para el intercambio de información).

ASCII (American Standart Code for Information Interchange)Este código utiliza patrones de siete bits para representar las letras mayúsculas y minúsculas del alfabeto inglés, además de los signos de puntuación, los dígitos 0 a 9 y cierta información de control, como por ejemplo las indicaciones de avance de línea, retorno de carro y tabulación.

ASCII puede ampliarse a un formato de ocho bits por símbolo, añadiendo un 0 en el extremo más significativo de cada uno de los patrones de siete bits. Esta técnica no solo permite obtener un código en el que cada patrón encaja convenientemente en las celdas típicas de memoria, con un tamaño igual a un byte, sino que también proporciona 128 patrones de bits adicionales (los que se obtienen asignando al bit extra el valor 1), dichos patrones adicionales pueden utilizarse para representar símbolos no contenidos en el alfabeto inglés y en su conjunto de signos de puntuación asociado.

La carta de Código ASCII 1968 de los E.E.U.U. fue estructurada con dos columnas de caracteres de control, una columna con caracteres especiales, una columna con números, y cuatro columnas de letras.

ASCII ExtendidoLa Organización Internacional de Estandarización ha desarrollado una serie de extensiones del código ASCII, cada una de las cuales se diseñó para satisfacer las necesidades de cada uno de los grupos de lenguajes existentes. Por ejemplo, uno de los estándares proporciona los símbolos necesarios para escribir texto en la mayoría de los idiomas hablados en Europa occidental. Entre sus 128 patrones adicionales se encuentran los símbolos correspondientes a la libra inglesa, a las vocales alemanas ä, ö y ü y a las vocales acentuadas del español. Los estándares ASCII ampliados definidos por ISO representaron un gran avance a la hora de permitir comunicaciones multilingües a nivel mundial.

Sin embargo, pronto aparecieron dos obstáculos importantes. En primer lugar, el número de patrones de bits adicionales disponibles en el código ASCII ampliado es simplemente insuficiente para representar el alfabeto de muchos idiomas asiáticos y de algunos del este de Europa. En segundo lugar, puesto que cada documento estaba restringido a utilizar símbolos en uno solo de los estándares seleccionados, no podían emplearse documentos que contuvierantextos pertenecientes a grupos de idiomas distintos. Ambos obstáculos resultaron ser bastante más graves de lo previsto a la hora de permitir el uso internacional de la tecnología de computadoras. Para resolver estos problemas, se desarrolló el código Unicode mediante la cooperación de varios de los principales fabricantes de hardware y software; dicho código ha obtenido rápidamente el respaldo del sector informático.

UNICODE

Almacenar la información en términos de caracteres codificados es poco eficiente cuando la información que se quiere almacenar es puramente numérica. La notación binaria es una forma de representar valores numéricos utilizando solo los dígitos 0 y 1, en lugar de los dígitos 0, 1, 2, 3, 4, 5, 6, 7, 8 y 9, como en el sistema tradicional decimal o en base diez.

Representación de valores numéricos

Representación de imágenesUn método para representar una imagen consiste en interpretar dicha imagen como una colección de puntos, cada uno de los cuales se denomina píxel, abreviatura de la expresión inglesa “picture element” (elemento de imagen). A continuación se codifica la apariencia de cada píxel y la imagen completa se representa como una colección de píxeles codificados. A este tipo de colección se le conoce como mapa de bits. Esta técnica es muy popular porque muchos dispositivos de visualización, como las impresoras y las pantallas de computadoraoperan basándose en el concepto de píxel.

Métodos de representación de imágenesEl método mediante el que se codifican los pixeles que componen un mapa de bits varía de una aplicación a otra. En el caso de una imagen simple en blanco y negro, cada píxel puede representarse mediante un único bit, cuyo valor dependerá de si el píxel correspondiente es negro o blanco. Esta es la técnica empleada en la mayoría de las máquinas de fax. Para fotografías en blanco y negro más elaboradas, cada píxel se puede representar mediante una colección de bits (normalmente ocho), lo que permite representar diversas tonalidades de gris.

En el caso de imágenes en color, cada píxel se codifica mediante un sistema más complejo. Existen dos enfoques bastante comunes. En uno de ellos, que denominaremos codificación RGB, cada píxel se representa mediante tres componentes de color: una componente roja, una componente verde y otra azul, lo que se corresponde con los tres colores primarios de la luz. Para representar la intensidad de cada componente de color normalmente se usa un byte. En consecuencia, hacen falta tres bytes de almacenamiento para representar un único píxel de la imagen original.

Unidades básicas para cuantificar datos1 Byte = 8 bits

1 KiloByte (KB) = 1,024 Bytes

1 MegaByte (MB) = 1,024 KB

1 GigaByte (GB) = 1,024 MB

1 TeraByte (TB) = 1,024 GB

1 PetaByte (PB) = 1,024 TB (TeraBytes)

1 ExaByte (EB) = 1,024 PB (PetaBytes)

1 ZettaByte (ZB) = 1,024 EB (ExaBytes)

1 YottaByte (YB) = 1,024 ZB (ZettaBytes)

Memoria Principal

Memoria PrincipalCon el objetivo de almacenar datos, una computadora contiene un enorme conjunto de circuitos, cada uno de los cuales es capaz de almacenar un único bit. Este conjunto de bits se conoce como memoria principal de la máquina.Organización de la memoriaLa memoria principal de una computadora está organizada en una serie de unidades accesibles denominadas celdas, siendo el tamaño típico de celda igual a ocho bits. (Una cadena de ocho bits se denomina byte. Por tanto, una celda de memoria típica tiene una capacidad de un byte.) Las computadoras pequeñas utilizadas en electrodomésticos tales como los hornos microondas pueden disponer de memorias principales compuestas por solo unos pocos cientos de celdas, mientras que las computadoras de mayor tamaño pueden tener miles de millones de celdas en su memoria principal.

Memoria RAMLa memoria principal o RAM (Random Access Memory, Memoria de Acceso Aleatorio) es donde el computador guarda los datos que está utilizando en el momento presente. El almacenamiento es considerado temporal por que los datos y programas permanecen en ella mientras que la computadora este encendida o no sea reiniciada.

Se le llama RAM por que es posible acceder a cualquier ubicación de ella aleatoria y rápidamente.

Físicamente, están constituidas por un conjunto de chips o módulos de chips normalmente conectados a la tarjeta madre.

Debido a la volatilidad y al tamaño limitado de la memoria principal de una computadora, la mayoría de las computadoras disponen de dispositivos de almacenamiento adicionales conocidos como sistemas de almacenamiento masivo (o de almacenamiento secundario), entre los que se incluyen los discos magnéticos, los discos CD y DVD, las cintas magnéticas y las unidades flash.

Entre las ventajas de los sistemas de almacenamiento masivo, con respecto a la memoria principal, podemos citar una menor volatilidad, mayores capacidades de almacenamiento, su bajo coste y, en muchos casos, la capacidad de extraer el medio de almacenamiento de la máquina, con el propósito de archivarlo.

Almacenamiento masivo

Durante años, la tecnología magnética ha sido la dominante dentro del sector del almacenamiento masivo. El ejemplo más común y que todavía se utiliza es el disco magnético, en el que se utiliza un fino disco giratorio con un recubrimiento magnético para almacenar los datos. Los cabezales de lectura/ escritura se colocan por encima y/o por debajo del disco, de modo que cuando el disco gira, cada cabezal recorre un círculo, denominado pista.

Sistemas magnéticos

Otra clase de sistemas de almacenamiento masivo utiliza la tecnología óptica. Un ejemplo es el disco compacto (CD, Compact Disk). Estos discos tienen 12 centímetros de diámetro y están compuestos de un material reflectante, cubierto con una capa protectora transparente. La información se almacena en estos discos creando variaciones en sus superficies reflectantes. Esta información se puede entonces extraer mediante un rayo láser que detecta las irregularidades en la superficie reflectante del CD, a medida que este gira.

Sistemas ópticos

La tecnología de CD se aplicó originalmente a las grabaciones de sonido,utilizando un formato de grabación conocido como CD-DA (Compact Disk- Digital Audio, Disco compacto-sonido digital) y los CD utilizados hoy día para el almacenamiento de datos emplean esencialmente el mismo formato. En particular, la información en estos CD se almacena en una única pista que gira en espiral alrededor del CD, como el surco de uno de esos discos de vinilo ya pasados de moda. Sin embargo, a diferencia de esos discos de vinilo, la pista de un CD se desarrolla en espiral desde el interior hacia el exterior. Esta pista está dividida en unidades denominadas sectores, cada uno con sus propias marcas de identificación y con una capacidad de 2KB de datos, que equivale a1⁄75 de un segundo de música en el caso de las grabaciones de audio.

Tecnología de los CD’s

Los CD tradicionales tienen capacidades que van desde los 600 a los 700MB. Sin embargo, los DVD (Digital Versatile Disks, discos digitales versátiles), que están construidos a partir de múltiples capas semitransparentes que actúan como superficies distintas cuando se las ilumina mediante un láser con un enfoque muy preciso, proporcionan capacidades de almacenamiento de varios GB. Dichos discos son capaces de almacenar largas presentaciones multimedia, incluyendo películas comerciales completas.

DVD

La tecnología Blu-ray, que utiliza un láser en el espectro azul-violeta de la luz (en lugar de un láser rojo) es capaz de enfocar el rayo láser con una precisión muy grande. Como resultado, los BD (Blu-ray Disks, discos blu-ray) proporcionan una capacidad cinco veces superior a la de un DVD. Esta capacidad de almacenamiento tan grande es necesaria para poder satisfacer las demandas del mercado del vídeo de alta definición.

Blu- Ray

Una propiedad común de los sistemas de almacenamiento masivo basados en tecnología magnética u óptica es que hace falta un cierto movimiento físico para almacenar y extraer los datos; por ejemplo, son necesarios discos giratorios, cabezales de lectura/escritura móviles y rayos láser que se enfocan en un punto u otro. Esto significa que el almacenamiento y la extracción de datos son lentos comparados con la velocidad de los circuitos electrónicos. La tecnología de las memorias flash tiene el potencial de acabar con esta desventaja. En un sistema de memoria flash, los bits se almacenan enviando señales electrónicas al medio de almacenamiento en el que hacen que los electrones queden atrapados en pequeñas cámaras de dióxido de silicio, alterando de esa manera una serie de pequeños circuitos electrónicos. Puesto que estas cámaras son capaces de mantener cautivos esos electrones durante muchos años, esta tecnología resulta adecuada para el almacenamiento de datos fuera de línea.

Unidades Flash

• Conjunto de circuitos electrónicos.• Interpreta y ejecuta las instrucciones de cada programa.

• Hace manipulaciones aritméticas (+, -, *, /) y lógicas (>,<,=).

• Se comunica con otras partes del sistema.

Procesador

¿Dónde se aloja el procesador?

Placa Madre o Motherboard

Sin importar su diseño, todos los procesadores tienen dos partes básicas:

Unidad de Control y Unidad Aritmético-Lógica

La unidad de Control

• Es el centro lógico de la computadora.• Las instrucciones o conjunto de

instrucciones, listan todas las operaciones que el CPU puede realizar.

• Cada instrucción del conjunto está expresada en microcódigo (conjunto de instrucciones básicas que le dicen al CPU la forma en que debe ejecutar las operaciones más complejas)

La unidad Aritmética-Lógica

• Debido a que todos los datos de una computadora están almacenados como números, gran parte del procesamiento que se lleva a cabo involucra la comparación de números o la realización de operaciones matemáticas.

• La ALU incluye un grupo de registros, ubicaciones de memoria de alta velocidad que están integradas directamente en el CPU y se utilizan para alojar los datos que se están procesando en este momento.

Características del procesador

Compatibilidad

Cada procesador tiene un conjunto de instrucciones integrado, un vocabulario de instrucciones que el procesador puede ejecutar.

Características del procesador

Rendimiento

•Velocidad: dada por el reloj interno, medida en Hz, MHZ, GHZ •Ancho del bus: capacidad de transporte 32 a 64 bits.•Tamaño de palabra: Nro. de bits que puede procesar la CPU cada vez (32 o 64).

Rendimiento

•Velocidad.Dada por el reloj interno, medida en Hz (ciclos/seg), MHZ (millones de ciclos/seg), GHZ (miles de millones de ciclos/seg).La velocidad del computador está ligada a la velocidad del reloj del sistema. Por ej. 800 MHz quiere decir que hace 800 millones de “tics” por seg.Un ciclo de reloj es un solo tic, o el tiempo que se toma para hacer que un transistor se apague y vuelva a encender.

•Ancho del busEl bus del sistema tiene dos partes: bus de datos y bus de direcciones.El bus de datos es una ruta eléctrica que conecta al CPU, memoria, y los otros dispositivos hardware en la tarjeta madre. El bus es un conjunto de cables paralelos. El número de cables en el bus afecta la velocidad con la cual pueden viajar los datos entre los componentes de hardware.El bus de direcciones solo conecta a la CPU con la RAM.Cada cable puede transportar un bit de datos por vez.La capacidad de transporte suele rondar por los 32 a 64 bits.La velocidad del bus está directamente vinculada a la velocidad del CPU.

•Tamaño de palabra

Indica la cantidad de datos con la cual puede trabajar la computadora en un momento. Mientras más grande sea el tamaño de la palabra, más rápido procesará la computadora un conjunto de datos. Se mide en bits (32, 64).

Compresión de datos

Con el objetivo de almacenar o transferir datos a menudo es útil (y a veces obligatorio) reducir el tamaño de los datos que hay que manipular, al mismo tiempo que se conserva la información subyacente. La técnica para hacer esto se denomina compresión de datos.

Técnicas Genéricas de compresión de datos

Los esquemas de compresión de datos pueden clasificarse en dos categorías:

- sin pérdidas y - con pérdidas. Los esquemas sin pérdidas son aquellos en los que no

se pierde informacióndurante el proceso de compresión. Los esquemas con

pérdidas son esos otrosque pueden llevar a la pérdida de una parte de la

información.

Las técnicas con pérdidas proporcionan a menudo un mayor grado de compresión que los que no tienen pérdidas y son, por tanto, bastante populares en aquellos entornos en los que pueden tolerarse los errores poco significativos, como es el caso de las imágenes y del audio.

Errores de comunicaciónCuando se intercambia información entre distintas partes de una computadora, o se transmite información desde la Tierra a la Luna, y viceversa, o también cuando se almacena simplemente la información, siempre existe la posibilidad de que el patrón de bits extraído al final no sea idéntico al patrón original. Las partículas de polvo o de grasa en la superficie magnética de grabación o los problemas de funcionamiento de un circuito pueden hacer que los datos se graben o se lean de manera incorrecta. El ruido estático en una ruta de transmisión puede corromper determinadas partes de los datos y, en el caso de algunas tecnologías, la radiación de fondo normal puede alterar los patrones almacenados en la memoria principal de la máquina.

Ejercicios de la clase1) ¿Por qué los fabricantes de computadoras están sacando

computadoras más rápidas constantemente?

2) ¿Cuáles son las funciones básicas que realiza una computadora? Explica cada una.

3) ¿Qué nuevos dispositivos piensas que podrían tener las computadoras del futuro?

4) ¿Cómo podemos definir al término información?

5) ¿Qué hace la RAM?

6) ¿Dónde se aloja el procesador?

7) ¿Cuál es la diferencia entre un CD, un DVD y un dispositivo Blu- Ray?

8) ¿Qué son los bits?

9) Convertir los siguientes números decimales a binarios: 100 – 77 – 83 - 135

Preguntas de debate

• ¿Debería haber una distinción en lo relativo a recopilar y difundir datos dependiendo de la forma de esos datos? En otras palabras, ¿los derechos para recopilar y difundir fotografías, audio o vídeo deberían ser iguales que los derechos de recopilar y difundir textos?

• ¿Fue ético desarrollar software en la década de 1970 utilizando solo dos dígitos para representar el año (como por ejemplo utilizar 76 para representar el año 1976), ignorando el hecho de que el software presentaría fallos en cuanto se llegara al fin de siglo. ¿Resulta ético emplear hoy día únicamente tres dígitos para representar el año (como por ejemplo, usar 982 para 1982 y 015 para 2015)?

BibliografíaBeekman, George. (2005). Introducción a la Informática. (6ª ed.). España, Madrid: Pearson Prentice-Hall. Código ISBN: 84-205-4345-4

J. Glenn Brookshear. (2012). Introducción a la Computación. (11ª Ed.). PEARSON EDUCACIÓN, S. A., Madrid. ISBN eBook: 9788478291380