21
Un sistema de computación distribuido

Un Sistema de Computación Distribuido

Embed Size (px)

DESCRIPTION

sistema distribuido

Citation preview

Un sistema de computacin distribuido

Un sistema de computacin distribuidoConsiste en un nmero de elementos de procesamiento, no necesariamente homogneos, que estn interconectados mediante una red de computadores, y que cooperan para la realizacin de ciertas tareas asignadas.

Como objetivo general, estos sistemas dividen un gran e inmanejable problema en piezas ms pequeas para resolverlo de una manera coordinada.La viabilidad econmica de este planteamiento procede de dos razones: Una mayor potencia de computacin emparejada a la resolucin de una tarea complejaQue cada elemento de procesamiento autnomo pueda ser administrado de manera independiente y desarrollar sus propias aplicacionesUna coleccin de ficheros almacenados en nodos diferentes de una red y el mantenimiento de las interrelaciones entre ellos a travs de hiperenlaces se ha convertido en una organizacin comn en Internet, todo ello mediante pginas web. Las funciones comunes de la administracin de una base de datos, incluyendo el procesamiento uniforme de las consultas y las transacciones, no se aplica an a este escenarioTecnologa paralela frente a distribuidaTomando nuestra atencin hacia las arquitecturas de sistema paralelo, existen dos tipos fundamentales de arquitecturas de sistema multiprocesador: Arquitectura de memoria compartida (estrechamente acoplada o tightly coupled). Varios procesadores comparten el almacenamiento secundario (disco) y la memoria primaria . Arquitectura de disco compartido (dbilmente acoplada o loosely coupled). Varios procesadores comparten el almacenamiento secundario (disco), pero cada uno de ellos tiene su propia memoria primaria.La arquitectura "nada compartido" es otro tipo de sistema multiprocesador.En ella, cada procesador tiene su propia memoria (disco) primaria y secundaria, no existe memoria comn, yesos procesadores se comunican mediante una red de interconexin de alta velocidad (bus o switch).Ventajas de las bases de datos distribuidas1. Administracin de datos distribuidos con distintos niveles de transparencia. De manera ideal, un DBMS debe ser una distribucin transparente en el sentido de ocultar los detalles de dnde est fsicamente ubicado cada fichero (tabla, relacin) dentro del sistema.

Son posibles los siguientes tipos detransparencias:Transparencia de red o de distribucin. Hace referencia a la autonoma del usuario de los detalles operacionales de la red. Puede dividirse en transparencia de localizacin y de denominacin.La transparencia de localizacin hace mencin al hecho de que el comando usado para llevar a cabo una tarea es independiente de la ubicacin de los datos y del sistema desde el que se ejecut dicho comando. La transparencia de denominacin implica que, una vez especificado un nombre, puede accederse a los objetos nombrados sin ambigedad y sin necesidad de ninguna especificacin adicional.Transparencia de replicacin. Como podemos ver en la Figura pueden almacenarse copias de los datos en distintos lugares para disponer de una mayor disponibilidad, rendimiento y fiabilidad.La transparencia de replicacin permite que el usuario no se entere de la existencia de copias.Transparencia de fragmentacin. Existen dos posibles tipos de fragmentacin: La horizontal distribuye una relacin en conjuntos de tuplas (filas)La vertical lo hace en subrelaciones, de modo que cada subrelacin est definida por un subconjunto de las columnas de la relacin original. Una consulta global del usuario debe ser transformada en varias consultas fragmentadas. La transparencia de fragmentacin permite que el usuario no se entere de la existencia de fragmentos.La transparencia de diseo y de ejecucin hace referencia a la libertad de saber cmo est diseada la base de datos distribuida y dnde ejecuta una transaccinAlgunos tipos de arquitecturas de base de datos.Arquitectura "nada compartido".

Arquitectura en red con una base de datos centralizada en una de sus ubicaciones

Arquitectura de basede datos distribuida autntica

2. Incremento de la fiabilidad y la disponibilidadstas son dos de las ms importantes ventajas de las bases de datos distribuidas. La fiabilidad est definida ampliamente como la probabilidad de que un sistema est funcionando (no cado) en un momento de tiempo La disponibilidad es la probabilidad de que el sistema est continuamente disponible durante un intervalo de tiempo.Cuando los datos y el software DBMS estn distribuidos a lo largo de distintas localizaciones, uno de ellos puede fallar, mientras el resto contina operativo. Slo los datos y el software almacenados en la localizacin que falla sern los que no estn disponibles. Esto mejora tanto la fiabilidad como la disponibilidad.Se logra una apreciable mejora al replicar tanto los datos como el software en ms de una ubicacin. En un sistema centralizado, el fallo de una ubicacin provoca la cada del sistema para todos los usuarios. En una base de datos distribuida, parte de la informacin puede estar inaccesible, pero s se podr acceder a otras partes de la base de datos.3. Rendimiento mejorado.Un DBMS distribuido fragmenta la base de datos manteniendo la informacin lo ms cerca posible del punto donde es ms necesaria. La localizacin de datos reduce el enfrentamiento por la CPU y los servicios de E/S, a la vez que atena los retardos en el acceso implcito a las redes de rea extendida. Cuando se distribuye una base de datos a lo largo de varias localizaciones, lo que obtenemos son bases de datos ms pequeas. Como resultado, las consultas locales y las transacciones de acceso a los datos de uno de estos sitios tienen un mayor rendimiento debido al menor tamao de esas bases de datos. Adems, cada sitio tiene que ejecutar un menor nmero de transacciones que si todas ellas fueran llevadas a cabo por una base de datos centralizada4. Expansin ms sencilla.En un entorno distribuido, la expansin del sistema en trminos de incorporacin de ms datos, incremento del tamao de las bases de datos o la adicin de ms procesadores es mucho ms sencilla.Funciones adicionales de las bases de datos distribuidas Seguimiento de los datos. La capacidad de controlar la distribucin de los datos, la fragmentacin y la replicacin expandiendo el catlogo DDBMS.Procesamiento de consultas distribuidas. La posibilidad de acceder a sitios remotos y de transmitir consultas y datos a lo largo de todos esos sitios mediante una red de comunicacin.Administracin de transacciones distribuidas. La facultad de disear estrategias de ejecucin de consultas y transacciones que accedan a los datos desde ms de una ubicacin y de sincronizar el acceso a los datos distribuidos y de mantener la integridad de toda la base de datos.Administracin de datos replicados. La capacidad de decidir a qu copia de un dato acceder y de mantener la consistencia de las copias de un elemento de datos replicado.Recuperacin de una base de datos distribuida. La facultad de recuperarse de las cadas de una localizacin individual u otro tipo de fallos, como los fallos en los enlaces de comunicacin.Seguridad. Las transacciones distribuidas deben ejecutarse con una adecuada administracin de la seguridad de los datos y contando con los privilegios de autorizacin/acceso de los usuarios.Administracin del directorio (catlogo) distribuido. Un directorio contiene informacin (metadatos) sobre los datos de la base de datos. Puede ser global a toda la DDB, o local para cada sitio. La colocacin y distribucin del directorio son temas relacionados con el diseo y las polticas.A nivel de hardware, los siguientes son los factores principales que distinguen un DDBMS de un sistema centralizado:Existen mltiples computadores llamados sitios o nodos.Estos sitios deben estar conectados por algn tipo de red de comunicacin para transmitir los datos y los comandos entre ellosEstos sitios pueden estar cercanos entre s (digamos, dentro del mismo edificio o grupo de edificios adyacentes) y conectados mediante una red de rea local, o estar geogrficamente distribuidos a larga distancia y enlazados a travs de una red de rea expandida o long-haul. Las redes de rea local suelen emplear cables mientras que las long-haul utilizan lneas telefnicas o satlites