Disponemos de un servidor ejecutando varias máquinas virtuales mediante KVM. Si bien funciona bien, nos preocupan posibles fallas de hardware en ese servidor físico.
Realizamos copias de seguridad todas las noches en un servidor físico diferente, pero restaurar las copias de seguridad lleva un tiempo. Si todo el sistema se quemara, tendríamos varias horas de inactividad.
Nos gustaría tener un sistema de conmutación por error (es decir, un servidor físico diferente) al que podamos cambiar si el servidor principal falla en algún momento.
Tengo varias preguntas al respecto:
- ¿Cómo haríamos para que el sistema de conmutación por error refleje el principal? Deben ser máquinas físicas diferentes para que podamos asegurarnos de que una sola falla de hardware no acabe con todo. ¿Existe software para algo como RAID 1 a través de la red? ¿Está esto relacionado de alguna manera con el equilibrio de carga?
- ¿Cómo enviaríamos solicitudes a la máquina de conmutación por error si la principal no responde? ¿Deberíamos hacer ping periódicamente y actualizar la información DNS si no responde a tiempo?
- Sería fantástico tener algo que funcionara a nivel de máquina virtual, es decir, si una sola máquina virtual no funciona, las solicitudes a esa deben reenviarse a la copia en el sistema de conmutación por error.
Respuesta1
Una de las mejores soluciones para su escenario es DRBD+Heartbeat. DRBD replica discos/particiones/LV entre servidores en tiempo real. No se recomienda para servidores que tienen muchas E/S pero funciona muy bien para entornos pequeños y medianos.
La documentación es muy buena, mira el sitio. Hay una sección llamada "Aplicaciones habilitadas para DRBD" con ejemplos y soluciones listas para usar. Puedes utilizar como base "Usar Xen con DRBD", adaptándolo a KVM.
Tengo muchos servidores con esta solución y funciona perfecto.