© 2010 VMware Inc. Todos los derechos reservados
Análisis técnico profundo: Reducción del tiempo
fuera de servicio al mínimo con las funciones
High Availability y Fault Tolerance de
VMware vSphere 5.1
La alta disponibilidad forma parte de la continuidad del negocio de TI
La virtualización es un excelente comienzo
Creación de depósitos de recursos compartidos • Permite compartir y asignar recursos de hardware de
manera transparente.
• Permite optimizar los recursos de manera automática.
Independencia del hardware • Permite recuperar una máquina virtual (VM, virtual machine)
en cualquier hardware de manera confiable.
• Permite presentar hardware estándar (virtual) a todas las cargas de trabajo.
La automatización es necesaria para reducir
los riesgos y el tiempo fuera de servicio.
Encapsulamiento • Toda la información sobre el sistema se almacena como
archivos planos en el disco.
• Se pueden proteger sistemas completos con herramientas de protección de datos.
Disponibilidad incorporada en la infraestructura para todas las aplicaciones
Sitio principal Sitio de recuperación
Alta disponibilidad
Protección de datos
Recuperación ante desastres
vMotion, DRS en modo
de mantenimiento
High Availability, Fault Tolerance
vSphere Data Protection
vSphere APIs for Data Protection
Site Recovery Manager
vSphere Replication
Mejoras recientes a la función High Availability (vSphere 5.0)
Fault Domain Manager (FDM)
Aumento de la escalabilidad y la confiabilidad
Implementación y configuración del agente
de anfitrión más rápidas
Modelo de maestro-esclavo
Eliminación de las dependencias de DNS
Datastores de heartbeat
Verificación de SSL obligatoria
Integración de Auto Deploy
Tamaño de la ranura de control de admisión configurable
Permanent Device Loss (PDL)
Manejo de All Paths Down (APD)
Cambio de SDK para el monitoreo de aplicaciones
Mejoras recientes a la función High Availability (vSphere 5.1)
Manejo de PDL y APD
disk.terminateVMOnPDLDefault
• Garantiza la interrupción de la VM cuando ocurre PDL.
• La VM se interrumpe cuando ordena E/S.
das.maskCleanShutdownEnabled
• La opción predeterminada es “False” (falso).
Recomendación: Establecer como “True” (verdadero).
• La función HA puede reiniciar las VM interrumpidas por PDL.
• Las VM desconectadas desde APD también se reinician.
Recomendaciones: Redes
Red de administración redundante
La menor cantidad posible de saltos
Ruta basada en la ID del puerto de origen
Política de conmutación de retorno = No
Habilitación de PortFast, Edge, etc.
Mismo tamaño de MTU
Simplificación
Recomendaciones: Redes
Nombres de grupos de puertos, etiquetas de red coherentes
Monitoreo del anfitrión durante el mantenimiento de la red
Uso del modo de mantenimiento
Subred distinta para vSphere High Availability
Especificación de dirección adicional de aislamiento de red
Posibilidad de que cada anfitrión se comunique
con el resto de los anfitriones
Simplificación
Recomendaciones: Redes
Opciones de configuración avanzadas
•das.allowNetwork[0-9]=
•das.isolationAddress[0-9]=
•das.useDefaultIsolationAddress= (true/false)
(verdadero/falso)
•das.failuredetectiontime
• No compatible con vCenter 5.x
Recomendaciones: Almacenamiento
Implementación de múltiples rutas
• HBA, procesadores de almacenamiento
(SP, storage processors), NIC, switches
•Política de múltiples rutas apropiada
Recomendaciones: Almacenamiento
Heartbeats de almacenamiento
• La función High Availability selecciona dos datastores
de manera predeterminada.
Recomendaciones: Almacenamiento
Heartbeats de almacenamiento • Todos los anfitriones del clúster deben ver los mismos datastores.
• Se pueden redefinir los datastores seleccionados de manera automática en caso de ser necesario.
Eventos de vSphere High Availability
Falla del anfitrión
Partición de red
Aislamiento del anfitrión
Falla del anfitrión
Maestro
Partición de red
Maestro
Aislamiento del anfitrión
Maestro
Respuesta ante el aislamiento del anfitrión
Leave Powered On (dejar encendido) (opción
predeterminada con 5.x)
Shutdown (apagar) (opción predeterminada con 4.x)
Power Off (desconectar)
P: ¿Qué opción debería usar?
R: Por lo general, la opción predeterminada,
pero depende…
Recomendaciones: Respuesta ante el aislamiento
¿El anfitrión podrá
seguir teniendo
acceso al
almacenamiento?
¿Las VM podrán
seguir teniendo
acceso a la red
de VM?
Política de
aislamiento
recomendada
Fundamento
Sí Sí Leave
Powered On
La VM se está ejecutando
bien, ¿por qué se debería
desconectar?
Sí No
Leave
Powered On
Shutdown
Usar la opción
Shutdown si el acceso
a la red es importante
No Sí Power Off Evitar tener dos instancias
de la misma VM en la red
No No
Power Off
Leave
Powered On
Usar la opción Leave
Powered On si la VM se
recuperará de la pérdida de
la red y el almacenamiento
Función Admission Control de VMware vSphere High Availability
“vCenter Server utiliza el control de admisión de
vSphere High Availability para garantizar la reserva de
recursos suficientes en el clúster para la recuperación
de la máquina virtual en caso de que se produzcan fallas
en el anfitrión”.
- Guía VMware vSphere® 5.0 High Availability Deployment Best Practices
Cantidad de anfitriones
• Antes conocido como Host Failures Cluster Tolerates (fallas del
anfitrión que tolera el clúster)
Porcentaje de recursos de clúster
Anfitriones de conmutación de recuperación dedicados
Cantidad de anfitriones
•Utilización del concepto de tamaños de ranuras
VMware vSphere
Función Admission Control de VMware vSphere High Availability
Cantidad de anfitriones: explicación de tamaños de ranuras
Sin reservas (explícitas) de CPU y memoria
• Uso de memoria de 32 MHz, 0 MB + sobrecarga de memoria
Ejemplo de tamaño de la ranura = memoria de 32 MHz, 65 MB
Función Admission Control de VMware vSphere High Availability
Cantidad de anfitriones: explicación de tamaños de ranuras
Reserva:
2 GHz
1024 MB
Reserva:
1 GHz
2048 MB
Función Admission Control de VMware vSphere High Availability
Cantidad de anfitriones: explicación de tamaños de ranuras
Reserva:
2 GHz
1024 MB
Reserva:
1 GHz
2048 MB
Función Admission Control de VMware vSphere High Availability
Cantidad de anfitriones: explicación de tamaños de ranuras
Reserva:
2 GHz
1024 MB
Reserva:
1 GHz
2048 MB
Función Admission Control de VMware vSphere High Availability
Cantidad de anfitriones: explicación de tamaños de ranuras
VM VM
Función Admission Control de VMware vSphere High Availability
Cantidad de anfitriones: explicación de tamaños de ranuras
VM VM
Función Admission Control de VMware vSphere High Availability
Cantidad de anfitriones: explicación de tamaños de ranuras
VM VM
Función Admission Control de VMware vSphere High Availability
Cantidad de anfitriones: explicación de tamaños de ranuras
VM VM
Función Admission Control de VMware vSphere High Availability
Cantidad de anfitriones: explicación de tamaños de ranuras
VM VM
Función Admission Control de VMware vSphere High Availability
Cantidad de anfitriones
vSphere
Client
vSphere
Web Client
Función Admission Control de VMware vSphere High Availability
Cantidad de anfitriones
VM VM
Función Admission Control de VMware vSphere High Availability
Recomendaciones: Admission Control
Cantidad de anfitriones
• Diseñar clústeres “de manera uniforme”
• Permitir que la función High Availability calcule
la configuración
• No usar reservas de VM a menos que sea
realmente necesario
• Evitar reducir el tamaño de las ranuras
• Ventaja: Los cálculos se realizan de manera automática
• Desventaja: Es posible que sea más conservador
Porcentaje de recursos de clúster
Función Admission Control de VMware vSphere High Availability
Recomendaciones: Admission Control
Porcentaje de recursos de clúster
• Diseñar clústeres “de manera uniforme”
• Es útil cuando las reservas varían de manera considerable
• La capacidad reservada para High Availability en cada
anfitrión es mayor que las reservas para las VM más
grandes (CPU, memoria)
• Ventaja: Flexibilidad
• Desventaja: Necesidad de cálculos manuales
Función Admission Control de VMware vSphere HA
Recomendaciones: Admission Control
Anfitrión de conmutación de recuperación dedicado
• Diseñar clústeres “de manera uniforme”
• De lo contrario, usar el anfitrión más grande como
anfitrión de conmutación de recuperación
• Es útil cuando las reservas varían de manera considerable
• La capacidad reservada para High Availability en cada
anfitrión es mayor que las reservas para las VM más
grandes (CPU, memoria)
• Ventajas: No presentan recursos fragmentados
• Desventaja: El anfitrión está inactivo cuando todo
funciona bien
Recomendaciones: Admission Control
“Hacer las cuentas y considerar los requisitos
del cliente. Recomendamos usar una política
de control de admisión basada en „porcentajes‟,
ya que es la más flexible”.
- Duncan Epping, Frank Denneman, (26/08/2012).
VMware vSphere 5.1 Clustering Deepdive (pág. 101). Edición Kindle.
• Establecer el porcentaje = un anfitrión (N+1) o múltiples
anfitriones (N+X)
• Volver a calcular cuando se agregan anfitriones nuevos
• 6 anfitriones, N+1 1 / 6 = 17 %
• 10 anfitriones, N+1 1 / 10 = 10 %
Servicio VM Monitoring de vSphere High Availability
VM Monitoring reinicia la VM si…
•No se recibe el heartbeat de VMware Tools.
•No existe actividad de red o disco dentro del intervalo
de estadísticas de E/S.
• Opción predeterminada de 120 segundos: personalizar
en vSphere Web Client
Servicio Application Monitoring de vSphere High Availability
Soluciones de terceros
•Symantec ApplicationHA
•Neverfail vAppHA
Apertura de Application Awareness API con vSphere 5.0
• Descargar VMware GuestAppMonitor SDK con 5.0
• Descargar VMware Guest SDK para vSphere 5.1
VMware vSphere Fault Tolerance (FT)
VMware vSphere Fault Tolerance (FT)
Se puede probar la conmutación de recuperación
con la función Fault Tolerance.
La función Fault Tolerance funciona con
High Availability y DRS.
Fault Tolerance se activa y se desactiva fácilmente.
Requisitos y limitaciones
• Ejemplos: almacenamiento compartido, solo una vCPU
• Consultar las secciones “Fault Tolerance Checklist”
(Lista de verificación de Fault Tolerance) y “Fault Tolerance
Interoperability” (Interoperabilidad de Fault Tolerance)
en la guía de vSphere Availability
¿Cómo funciona Fault Tolerance?
Se crea una VM con Fault Tolerance duplicada
(secundaria).
Se utiliza la tecnología VMware vLockstep.
Los eventos se graban en la VM principal.
Los eventos grabados se transmiten a la VM secundaria.
Los eventos se reproducen en la VM secundaria.
Resumen
La virtualización brinda las bases para una mejor
disponibilidad.
Las funciones High Availability y Fault Tolerance
de vSphere brindan una recuperación automatizada
ante el tiempo fuera de servicio no planificado.
Niveles de disponibilidad: High Availability para la
mayoría de las cargas de trabajo, Fault Tolerance
para las más importantes.
Gracias
Este webcast está grabado, por lo que se le enviará un enlace para la versión cuando lo solicite
junto con una copia de las diapositivas en PDF en un correo electrónico posterior.
Para obtener más información sobre el webcast, visite www.vmware.com/go/webcasts. Síganos en Twitter en www.twitter.com/vmwareevents.