
Sé que con Ploop pierdes espacio en disco a medida que se agregan/eliminan archivos dentro de un contenedor y tienes que compactar manualmente el contenedor, pero también he leído que si reinicias o hay una falla, los contenedores pueden volverse no recuperables.
¿Existen formas de reiniciar correctamente los servidores OpenVZ para evitar contenedores dañados?
Respuesta1
Incluso con un cierre sucio de contenedores bloqueados, generalmente es suficiente hacer un fsck. No es muy diferente de apagar el hardware real durante las operaciones de escritura. Como supongo que utilizarás un sistema de archivos con un registro de transacciones en esos ploops, no deberías tener más problemas.
Como mencionó Brian, un apagado adecuado del nodo host dejará sus contenedores limpios y sus ploops desmontados.
Si está utilizando contenedores basados en directorios que utilizan el mismo sistema de archivos que el nodo host, ya tiene una pequeña posibilidad de corrupción. Creo que en la práctica no hay mucha diferencia, sólo que quizás haya que considerar el tiempo de recuperación. Muchos ploops pueden tardar más en fsck que el sistema de archivos de un nodo host y pueden requerir mucha interacción manual.
Por otro lado, si su nodo host tiene un sistema de archivos muy grande, fscking podría llevar mucho tiempo y eso deja todos esos contenedores inactivos durante fsck. Los contenedores que utilizan ploop se pueden iniciar de forma escalonada después de que el nodo host vuelva a funcionar, siempre que el nodo host en sí no tenga nada que bloquear.
Podría mitigarlo teniendo algún tipo de configuración de alta disponibilidad en la que los nodos host carguen los datos de su contenedor desde el almacenamiento central y se enciendan o apaguen entre sí en caso de fallas, pero supongo que eso es ir demasiado lejos.
¿Cuáles son tus razones para considerar el ploop? Lo hemos considerado para un rendimiento más rápido a través de NFS, donde muchos archivos pequeños en un contenedor realmente ralentizan las cosas. Pero como estás mencionando la corrupción del sistema de archivos, probablemente ese no sea tu escenario.
Respuesta2
No, debes esperar hasta que cada ploop se detenga correctamente.
Los contenedores ploop deben iniciarse para acceder a sus archivos a través de su directorio raíz.
Los contenedores simpfs son estructuras de directorios similares a chroot, por lo que se puede acceder a ellos independientemente de si están activados o desactivados.
Gestiono miles de contenedores y no puedo perder el tiempo esperando. Debo esperar a que los contenedores ploop estén activos cada vez que necesito acceder o realizar la migración, o esperar hasta que se apague, para administrar el host que tiene contenedores ploop. Además, si ploop se daña entonces tienes que empezar de nuevo, ya no está. Como experimento estos daños no una o dos veces, lo llamo un sistema poco confiable, independientemente de lo bueno que debería ser.