¿Cuál es el mejor método para lograr una redundancia total en un servidor dedicado?

¿Cuál es el mejor método para lograr una redundancia total en un servidor dedicado?

He estado leyendo sobre la redundancia total para lograr casi, si no el 100%, tiempo de actividad para sus aplicaciones de misión crítica (manejo de datos financieros) que se ejecutan en un servidor dedicado, pero todavía no puedo entender cómo podría hacer esto.

1) Digamos que tengo varias aplicaciones web (con archivos grandes y frecuentes y actualizaciones de bases de datos) ejecutándose en mi servidor actual. Por lo que leí, necesitaría conseguir otro servidor dedicado (como servidor de respaldo) donde pudiera reflejar todos los archivos y datos de la base de datos, y si mi servidor principal fallara por algún motivo, mi servidor de respaldo llevaría la carga de inmediato. La transferencia del servidor principal al servidor de respaldo se realiza a través de DNS. ¿Es esto correcto? ¿Existe una manera mejor de lograr la redundancia que esta?

2) Si hiciéramos lo que mencioné en el punto 1, ¿qué pasaría si el servidor principal volviera a conectarse? ¿Cómo se pondría al día el servidor principal con todos los cambios realizados en el servidor de respaldo?

3) ¿Existe alguna guía definitiva que pueda leer sobre la mejor manera de hacer esto? Ya busqué en Google, pero lo que encontré principalmente no funcionaría para nosotros porque nuestras aplicaciones web no pueden estar inactivas durante al menos 5 minutos y no podemos perder 5 minutos de datos.

4) ¿Existe algún servicio que pueda hacer esto por nosotros? Dado que ya contamos con un servidor dedicado, el servicio tendría que funcionar en el entorno de trabajo existente. Pero preferiría poder aprender cómo hacerlo yo mismo.

Les agradecería mucho si pudieran indicarme la dirección correcta aquí.

Respuesta1

Esto depende completamente de la arquitectura y las opciones de disponibilidad de las aplicaciones específicas en uso.

¿Su base de datos admite una implementación en clúster? ¿Una implementación reflejada/replicada? ¿Ambos? ¿Cuáles son las advertencias de cada uno? ¿Cuál es el proceso de conmutación por error/recuperación? ¿Los requisitos de asignación de recursos? ¿Qué pasa con tu aplicación web? ¿Se puede agrupar eso? ¿Carga equilibrada? ¿Ambos? ¿Qué pasa con su ISP? ¿Tiene conexiones a Internet redundantes? ¿Desde diferentes conductos que llegan a diferentes lados del edificio para que la construcción no afecte a ambos? ¿Cuál es tu configuración de potencia? ¿Tiene fuentes de alimentación redundantes? ¿UPS redundantes? ¿Un generador para el Datacenter?

Estas preguntas no deben responderse aquí; su objetivo es mostrarle cómo se ve la punta del iceberg para diseñar este tipo de solución. El 100% de tiempo de actividad es un objetivo inalcanzable, pero si desea acercarse lo más posible, debe contratar a alguien que tenga experiencia en hacerlo, ya que no está ni cerca de estar listo según el contenido de su pregunta.

Respuesta2

MDMarra tiene razón, esta no es una pregunta que razonablemente pueda responderse definitivamente aquí (+1).

Debe analizar su aplicación en las siete capas del modelo OSI y luego agregar redundancia encadanivel. Lo más probable es que necesites la opinión de todos los desarrolladores y administradores involucrados.

Cuando la gerencia comience a quejarse del precio, prepárese para tener una discusión sobre el costo del tiempo de inactividad frente a la redundancia. Una buena regla general es que cada punto decimal (99,9% -> 99,99% -> etc) equivale a otro cero al final del costo, por lo que probablemente todo se reducirá a un diseño y una ejecución bien investigados que satisfagan las necesidades técnicas y preocupaciones de costos de la administración. No tiene mucho sentido crear una solución de un millón de dólares para proteger una aplicación de 1.000 dólares.

Sin embargo, si la gerencia le está escribiendo un cheque en blanco, estoy seguro de que habrá muchas personas que estarían dispuestas a consultar =)

información relacionada