Tarea 7 - Plan de Contingencia.pdf

Embed Size (px)

Citation preview

  • 7/31/2019 Tarea 7 - Plan de Contingencia.pdf

    1/11

    INSTITUTO TECNOLGICO DE COSTA RICAESCUELA DE INGENIERA EN COMPUTACIN

    ADMINISTRACIN DE LA FUNCIN DE INFORMACIN

    Plan de Contingencia

    Empresa MovilSoft

    Elaborado por:

    Diego Rojas Chacn

    Eduardo Gamboa Urea

    Manuel Murillo Snchez

    01/10/2012

  • 7/31/2019 Tarea 7 - Plan de Contingencia.pdf

    2/11

    Instituto Tecnolgico de Costa Rica

    Plan de Contingencia

    MovilSoft

    1

    Plan de Contingencia

    IntroduccinMovilSoft es una empresa costarricense dedicada a desarrollar, implementar y mantener

    soluciones de software para cualquier plataforma, as como servicios computacionales en la nube

    con sistemas y herramientas de alta tecnologa para empresas. Los sistemas de informacin son

    esenciales para la empresa, pues adems de ofrecer servicios en la nube a sus clientes, quienes

    requieren que ese servicio est siempre disponible y funcionando de una manera ptima, la

    empresa tambin apoya sus procesos de desarrollo, administrativos y financieros en esos sistemas

    de informacin y en plataformas tecnolgicas que son vulnerables a amenazas de origen natural,

    humano y tcnico.

    Lo anterior evidencia la necesidad de que MovilSoft cuente con un plan de contingencia de

    tecnologas de informacin y comunicaciones que permita mitigar el impacto que pueda generar

    cualquier eventualidad que ponga en riesgo la integralidad y acceso a la informacin de la

    empresa tanto en medio fsico como electrnico. Para esto se necesita hacer partcipes a todos los

    miembros de la empresa, con el fin de lograr una mayor capacidad de respuesta ante cualquier

    eventualidad que se pueda presentar.

    El presente documento contiene los detalles del plan de contingencia de tecnologas de

    informacin de la empresa MovilSoft.

    Informacin de Soporte

    Objetivos del plan

    Objetivo General

    Establecer el plan de contingencia que permita el desarrollo gil y estructurado que garantice la

    continuidad de las operaciones de Tecnologas de Informacin y Comunicaciones de la empresa

    MovilSoft y del cual tengan conocimiento todos los miembros de la empresa.

    Objetivos Especficos1. Proteger al personal y activos corporativos.2. Asegurar la continuidad de las operaciones.3. Garantizar la reanudacin de los procesos crticos dentro de los mrgenes de tiempo

    tolerables.

    4. Minimizar el proceso de toma de decisiones durante una contingencia.5. Reducir los efectos negativos ocasionados por el caos.

  • 7/31/2019 Tarea 7 - Plan de Contingencia.pdf

    3/11

    Instituto Tecnolgico de Costa Rica

    Plan de Contingencia

    MovilSoft

    2

    6. Cumplir con requerimientos legales, contractuales y gubernamentales al aplicar lasmedidas de contingencia.

    7. Eliminar la necesidad de desarrollar nuevos procedimientos durante la contingencia.8. Minimizar la posibilidad de prdida de informacin crtica para el servicio.9. Mantener el servicio al cliente.

    Alcance del plan

    El plan de contingencia aqu especificado comprende los siguientes aspectos:

    Activacin y notificacin de eventos que ocurran. Aseguramiento de la continuidad del servicio por falla de continuidad del fluido elctrico,

    falla de los sistemas de informacin o falla del servicio de internet.

    Recuperacin de desastres: Recuperacin de informacin de los sistemas. Actividades de reconstitucin para los riesgos identificados.

    Anlisis e identificacin de riesgos y amenazasA continuacin se enlistan los riesgos y sus factores contemplados dentro del alcance del plan:

    Riesgo/Amenaza Factor

    Fallas en el equipo Alto

    Accin de virus Medio

    Fallas por tensin Alto

    Fuego Medio

    Terremoto Medio

    Impacto en el negocio

    Cese de operaciones de desarrollo. Interrupcin del servicio en la nube. Prdidas econmicas. Prdida de confianza de lo clientes. Prdida de clientes. Imposibilidad de realizar tareas administrativas como facturacin. Imposibilidad de admitir pedidos. Impacto negativo en el tiempo de desarrollo.

    Supuestos

    El Director del Departamento de Tecnologas de Informacin revisa y aprueba todos losaspectos incluidos en este plan de contingencia.

    La empresa cuenta con los recursos necesarios para la ejecucin de las accionespropuestas en este plan de contingencias.

    El plan de contingencias es conocido por cada miembro de la organizacin,independientemente de su posicin dentro de la empresa.

  • 7/31/2019 Tarea 7 - Plan de Contingencia.pdf

    4/11

    Instituto Tecnolgico de Costa Rica

    Plan de Contingencia

    MovilSoft

    3

    Fase de activacin y notificacin

    Criterios de activacin

    Riesgo/Amenaza Criterios de activacin

    Fallas en el equipo Comportamiento inesperado delequipo. Apagado o suspensin repentina. Problemas de conexin a la red Local o

    Internet.

    Sonidos extraos del equipo.Accin de virus Comportamiento inesperado del

    sistema operativo de los

    dispositivos/equipo.

    Aumento de tiempo de iniciacin de lossistemas.

    Sectores de disco duros daados. Aparicin de mensajes de error no

    comunes.

    Cambio en caractersticas de archivos. Anomalas en teclado, video, RAM. Reduccin considerable de espacio en

    disco.

    Aparicin de programas residentes enmemoria desconocidos.

    Fallas por tensin Oscilaciones de tensin elctrica. Apagado y encendido inmediato de

    equipo. Equipo daado por tensin.

    Fuego Humo. Sobrecalentamiento de equipo. Corto circuitos.

    Terremoto Movimiento telrico.

  • 7/31/2019 Tarea 7 - Plan de Contingencia.pdf

    5/11

    Instituto Tecnolgico de Costa Rica

    Plan de Contingencia

    MovilSoft

    4

    Procedimientos de notificacin

    En todos los riesgos descritos anteriormente, se avisar primero, a las autoridades

    correspondientes, con tal de bajar, al menos en lo posible, los riesgos que se tengan en la

    estructura o equipo de las empresas.

    En el caso de las fallas de equipo (las cuales pueden ser variadas), se le notificar al departamento

    de TI para que tomen las acciones pertinentes. Primero, se enviar un mensaje automtico (si el

    error es detectado por medio de algn programa de monitoreo) o de manera manual, cuando un

    usuario advierta el problema.

    Luego de esto, se enva un mensaje a los usuarios, para advertir que sus actividades estn en

    riesgo, y si es necesario, evacuen el rea, esto en caso de que la estructura se vea comprometida.

    Gestin y evaluacin de imprevistos

    En el caso de que surja algn evento, del cual no se tenga documentacin del mismo, se avisar al

    departamento correspondiente para poder encontrar una solucin eficaz, de manera rpida y sin

    comprometer las actividades cruciales del negocio.

    Para poder llevar esto a cabo, y recuperar los equipos que se han daado, en especial, la

    informacin contenidas en ellos, se harn respaldos peridicamente, adems de tener equipos en

    modo de fallo, los cuales entraran en accin en el momento que el dispositivo principal falle. Esto

    para poder continuar con los trabajos crticos de la empresa, mientras se soluciona el problema

    principal.

    Fase de recuperacinSecuencia de actividades de recuperacin

    A continuacin se detalla la secuencia de actividades de recuperacin a realizar en caso de que

    ocurra cada una de las amenazas descritas en la seccin de informacin de soporte:

    En caso de fallas en el equipo (Tipo de Riesgo Alto)

    Proceder de la siguiente manera:

    1. Traslado de operaciones a otras dependencias fsicas que estn en buen estado.2. Revisar el estado fsico del equipo problemtico.3. Revisar el entorno o ambiente donde est ubicado el equipo.4. Si todo parece estar bien, realizar pruebas especficas al equipo.5. Reportar el equipo daado.6. Remplazar el equipo en un lapso de 15 minutos.7. Reanudar operaciones utilizando el nuevo equipo.

  • 7/31/2019 Tarea 7 - Plan de Contingencia.pdf

    6/11

    Instituto Tecnolgico de Costa Rica

    Plan de Contingencia

    MovilSoft

    5

    En caso de Infeccin por Accin de Virus (Tipo de Riesgo Medio)

    La empresa cuenta con un Software de antivirus que es el MCAfeee versin 8 para los servidores y

    Kasperski 2011 para las estaciones y se pone en lnea a todos los servidores y PC desde una

    carpeta publica, realizando esta accin, mediante un correo electrnico que el usuario ejecuta

    con un simple botn del Mouse, tambin se enva, esta actualizacin a las unidades, as como lasrecomendaciones de seguridad sobre el tema.

    Sin embargo en caso de infeccin masiva de virus se debe de seguir el siguiente plan de

    contingencia.

    Si la infeccin es va red a los Servidores y PCS, proceder de la siguiente forma:

    1. Revisar las alertas que enva el antivirus instalado en forma peridica y ver el tipo devirus que esta propagando.

    2. Detectar el origen de la infeccin del virus (mediante el mismo software les indica elusuario y archivos).

    3. Desconectar de la red el equipo que esta infectado y que est renviando el virus.4. Comprobar si el usuario ha actualizado el ltimo DAT.5. Comprobar si tiene carpetas compartidas en forma total y proceder a no

    compartirlas.

    6. Proceder a limpiar los archivos con la opcin de: LIMPIAR o CLEAN INFECTED FILESNO CON DELETED por que esta opcin podra borra archivos del sistema operativo,

    quedando inutilizada la maquina.

    7. Una vez limpio el equipo, proceder a realizar una copia de Seguridad solo de laDATA.

    8. Si no se lograra limpiar en forma satisfactoria, el equipo, por que los archivos delsistema operativo han sido daados se proceder a formatear el disco

    reinstalndole el sistema operativo y transfiriendo la data de seguridad, que se tiene

    en caso de Servidores y de los buzones personales en caso de PC, donde se

    custodia la data de los usuarios.

    Si la infeccin es por lista de correo proceder de la siguiente forma:

    Seguir los pasos anteriores:

    8..1.Coordinar con los soporte de las unidades de negocio, para realizar la accincoordinada.

  • 7/31/2019 Tarea 7 - Plan de Contingencia.pdf

    7/11

    Instituto Tecnolgico de Costa Rica

    Plan de Contingencia

    MovilSoft

    6

    8..2.Entrar al Servidor donde esta instalado el Correo a los servicios y deshabilitar elservicio de Message Transfer Agent para que no siga reenviando los correos.

    8..3.Proceder a eliminar el mensaje que se encuentra en cola y que esta infectado.8..4.Proceder a pasar el antivirus con las opciones indicadas.

    En Fallas por tensin (Tipo de Riesgo Alto)

    La empresa a pesar de que cuenta con sistemas de proteccin elctrica como son, pozos a tierra,

    lneas filtradas e independientes, para sus equipos de computo y de comunicaciones, en cada

    uno de sus locales, adicionalmente a que tambin se cuenta con otros tipos de proteccin como

    son los sistemas de reserva de energa UPS, (stand by) y supresores de pico para las PC y

    estabilizadores en algunos casos, etc.

    Sin embargo muchos de estos locales quedan en lugares donde la tensin no es de la mejor

    calidad caso de la Sede Principal, lugares donde se registran continuas oscilaciones, fluctuaciones

    de tensin etc. eventos que muchas veces nos han malogrado equipos, debiendo de expresar

    nuestra queja contra la calidad de proteccin interna que tienen los equipos los cuales son muy

    sensibles, requiriendo sistemas de proteccin mas complejos y caros para la proteccin de estos;

    estos equipos de proteccin ya han sido solicitados pero no se compran en la actualidad, tales

    como UPS TRUE ON LINE y no STAND BY que son los que actualmente se tiene, transformadores

    de aislamiento, etc.

    En caso de presentarse fallas por tensin se deber proceder de la siguiente forma:

    Fluctuaciones

    Son fallas que se presentan como parpadeos constantes, de la energa, causando problemas en las

    instalaciones internas, llegando a malograr equipos de cmputo si no se tiene las siguientes

    precauciones:

    1. Si hubiere fluctuaciones (flickers), constantes y prolongadas, proceder a apagarlos equipos, previo aviso a los usuarios.

    2. Llamar a la ENOSA para identificar si la falla es del sistema general, o es unproblema aislado, en el tablero de alimentacin de la sala de Cmputo.

    3. Si la falla es originada en el sistema general, se debe esperar a que se normalice,para proceder a encender los equipos Y conectar a los usuarios.

    4. Si la falla es originada por algn factor local, deber, proceder a revisar, loelementos del tablero de la sala de Computo como son, fusibles, trmicos, cables

    flojos, o revisar si existe algn equipo que este ocasionando esta falla, si no se

    detecta localmente se debe de proceder a revisar la conexiones, en la Subestacin

    de donde se esta independizando la energa, revisar los bornes flojos u otros, Si aun

  • 7/31/2019 Tarea 7 - Plan de Contingencia.pdf

    8/11

    Instituto Tecnolgico de Costa Rica

    Plan de Contingencia

    MovilSoft

    7

    no se detecta la falla ubicar si estn realizando algn trabajo con equipos de alto

    consumo, como son maquinas soldadoras, etc. y que se hayan conectado a la red de

    los equipos de computo por equivocacin.

    Corte de energa imprevisto

    Es el corte intempestivo del suministro de la energa elctrica, ocasionado por algn factor

    externo, como son (corte de la lnea de transmisin, accidentes, falla en los sistemas de

    proteccin, etc.) esta falla, tanto en el origen como al final (retorno de la energa) pueden causar

    daos a los equipos de computo por lo que se debe de seguir el siguiente procedimiento:

    1. Se activar la luz de emergencia2. Revisar la carga del UPS que alimentan los equipos, para los casos de corte de

    energa y determinar el tiempo que queda de energa auxiliar.

    3. Llamar a ENOSA, para identificar si la falla es del sistema general, o es un problemaaislado, en el tablero de alimentacin de la sala de Cmputo.

    4. Por seguridad utilizar la energa que se tiene en los UPS para apagar los equipos enforma correcta.

    5. Si la falla es originada en el sistema general, se debe esperar a que se normalice,(siempre en coordinacin), para proceder a encender los equipos conectar a los

    usuarios.

    6. Si la falla es originada por algn factor local, deber, proceder a revisar, loselementos del tablero de la sala de Computo como son, fusibles, trmicos, cables

    flojos, o revisar si existe algn equipo que este ocasionando la falla, si no se

    detecta localmente se debe de proceder a revisar la conexiones, en la Subestacin

    de donde se esta independizando la energa, revisar los bornes flojos u otros, Si aun

    no se detecta la falla ubicar si estn realizando algn trabajo con equipos de alto

    consumo, como son maquinas soldadoras, etc., y que hayan conectado a la red

    ocasionando un corto circuito, y que no permita, restituir la energa, en forma

    normal.

    7. Si la falla es en el sistema Interconectado (general) se deber esperar que restituyala energa, mas un tiempo de unos 15 minutos ms, aproximadamente para que seestabilic y se puedan levantar los sistemas.

    8. Si la falla es local proceder a la reparacin, o remplazo, de los elementos quecausaron la falla, para esto se debe de solicitar el apoyo de los tcnicos de

    emergencia, (se recomienda tener fusibles, y una llave trmica de respaldo de

    acuerdo a la capacidad de su tablero). Una vez reparada la falla se debe de conectar

    la energa para ver el comportamiento, de esta y no encender los equipos de

  • 7/31/2019 Tarea 7 - Plan de Contingencia.pdf

    9/11

    Instituto Tecnolgico de Costa Rica

    Plan de Contingencia

    MovilSoft

    8

    cmputo hasta despus de 15 minutos aproximadamente despus de la restitucin

    de la energa.

    En caso de Fuego (Tipo de Riesgo Medio)

    La empresa, a pesar de que cuenta con sistemas de proteccin, contra incendios, como son,

    extintores manuales, conexiones nuevas de energa (en algunas reas), equipos de bajo

    consumo, vas de acceso y de evacuacin, amplias, etc., sin embargo algn incidente involuntario,

    puede ocasionar, el inicio de un Incendio para lo cual se deber proceder de la siguiente manera:

    1. Si el inicio del incendio se produce en horas de labores, deber de proceder a darla alarma a todo el personal de la oficina y colindantes, y a los bomberos.

    2. Desconectar las fuentes de alimentacin elctricas (sin perjuicio de exponer lavida).

    3. Si el tiempo lo permite y si la fuente del siniestro esta lejos pero se puede propagarhacia los equipos principales de computo (servidores) deber retirar los equipos

    hacia un lugar seguro, discos o ultimas copias q tenga a la mano y (sin que esto

    signifique riesgo de exponer su vida).

    4. Se deber proceder a sofocar el fuego utilizando el extintor correcto para el tipo defuego, se adjunta un cuadro prctico como gua.

    En caso de terremoto (Tipo de Riesgo Medio)

    Se deber proceder de la siguiente manera:

    1. Cesar operaciones de la empresa de manera inmediata.2. Seguir el protocolo de la empresa para sismos y terremotos.3. Revisin de instalaciones de la empresa por parte de un experto en construcciones.4. Si las instalaciones estn bien y se da el visto bueno por parte del experto, revisar los

    sistemas de informacin de la empresa, los equipos y dems activos fsicos. En caso

    contrario se suspenden las operaciones de la empresa en el lugar por un periodo que ser

    comunicado por el director del departamento de TI.

    5. Analizar y corregir fallas.6. Reanudar operaciones.

    Procedimientos generales de recuperacin

    Una vez que la situacin haya sido controlada en su totalidad, se deben hacer un recuento de los

    daos, tanto a corto como a largo plazo, para poder averiguar que equipo se ha daado, y si es

    crtico su remplazo.

    Luego de esto, se remplazar el equipo y se cargar en el con los respaldos que se han guardado

    en periodos anteriores, retornando al sistema en un estado antes de que ocurriera el evento que

  • 7/31/2019 Tarea 7 - Plan de Contingencia.pdf

    10/11

    Instituto Tecnolgico de Costa Rica

    Plan de Contingencia

    MovilSoft

    9

    caus su prdida. Este punto tambin aplica si el dao se da en los datos almacenados dentro del

    equipo.

    Si el caso es que el equipo se apag durante la operacin, por cualquiera de las razones expuestas

    en los puntos de arriba, se procede a encender el equipo e iniciar los servicios necesarios, siempre

    y cuando, la situacin actual lo permita.

    Las acciones anteriores se harn siempre con el aval tanto del administrador de TI como con la

    aprobacin del gerente general, tomando en consideracin los factores de riesgos para el equipo o

    para los empleados de la compaa

    Fase de ReconstitucinEn este apartado, se describir de manera general, como la empresa se va a recuperar de un

    desastre determinado.

    Procesamiento actual

    Se medir la capacidad del procesamiento de datos, dndole nfasis a que tan rpido se hacen las

    labores criticas de la empresa, ignorando los procesos no cruciales, o que no son de vital

    importancia para el negocio. Una vez determinado dicho valor, se analiza la posibilidad de que se

    necesite equipo nuevo, de manera que se mantenga la eficiencia que se tena antes del riesgo

    generado.

    Pruebas

    Se realizarn pruebas de rendimiento del sistema nuevo, para poder deducir el dao que se haya

    producido, de manera medible y comparable. Entre las pruebas que se harn son las siguientes:

    Dao Estructural: Se har una inspeccin visual preliminar, para poder ver si se vieroncomprometidas partes del edificio, y si es posible repararlas a la brevedad.

    Pruebas de Corriente Elctrica: Se determinar si el flujo elctrico llega correctamente atodo el edificio, enfocndose en las reas primordiales del mismo.

    Pruebas de eficiencia de equipo: Se prueba el funcionamiento del equipo despus de quehaya pasado el incidente, valorando si puede continuar operando con normalidad, o

    necesita un remplazo en un plazo determinado,

    Notificaciones

    Una vez pasado el problema, se proceder a notificar a las autoridades que corresponden, luego

    de verificar que todo se encuentra en un estado estable. Luego, se notifica al gerente general

    acerca del problema, sus posibles implicaciones, y el estado del equipo, tanto operativo, como de

    trabajo.

  • 7/31/2019 Tarea 7 - Plan de Contingencia.pdf

    11/11

    Instituto Tecnolgico de Costa Rica

    Plan de Contingencia

    MovilSoft

    10

    Adems de esto, se le estarn enviando notificaciones peridicas acerca del como se ha ido

    avanzando en la recuperacin de la empresa, y del momento en que se termine la recuperacin

    inicial.

    Obviamente, se informar a los empleados de la situacin interna, y de cuando podrn volver a

    sus operaciones, en caso de que el ambiente de trabajo no sea el mejor para realizar sus labores

    diarias.

    Almacenamiento de datos

    De ser posible, los datos sern almacenados en el mismo equipo que se tenan anteriormente. Esta

    posibilidad cambia en caso de que dicho equipo sea daado, y quede en estado inoperable (tal

    como se define en las pruebas realizadas). Si este es el caso, se procede a evaluar si los datos son

    crticos. Si este es el caso, se restaurar un respaldo en un equipo alterno y en un lugar distinto al

    actual. Esto para que se pueda recuperar o cambiar el equipo original. En caso de que no se

    pudiera conseguir algn equipo en un lugar distinto, se alquilar, por tiempo indefinido, hasta que

    se pueda adquirir el equipo equivalente al que la empresa tenia anteriormente.