¿Hay alguna forma de bloquear/desbloquear un motor alojado en oVirt?

¿Hay alguna forma de bloquear/desbloquear un motor alojado en oVirt?

Tengo una situación extraña con mi motor alojado en oVirt.

Tenemos un cluster oVirt configurado usando gluster como almacenamiento para los isos de los motores y toda la información. Hace aproximadamente una semana, dos de los tres servidores cayeron. Reiniciamos las máquinas unas tres veces y los hosts de gluster informaron que estaban conectados y no informaron ningún error de cerebro dividido.

El proceso del motor alojado intentó abrir el motor alojado en uno de los hosts, pero entró en un estado EngineUnexpectedlyDown. Y restaría 1600 de la puntuación del servidor y luego intentaría mostrarlo en la siguiente máquina hasta que todos terminaran con una puntuación de aproximadamente 800 y simplemente intentaría arrancar en una máquina y luego se quedaría ahí con un mensaje "no se pudo alcanzar". mensaje "VM".

Hemos descubierto que el motor alojado realmente se está iniciando, ya que podemos conectarnos a él con un cliente vnc. Pero parece estar en una especie de estado bloqueado. Si inicia sesión en el motor alojado, incluso como root, no se pueden cambiar archivos y la máquina virtual es inaccesible por cualquier otro medio.

¿Hay alguna forma de ver si la máquina virtual está bloqueada o es de solo lectura? ¿Y hay alguna forma de quitar dicho bloqueo?

Respuesta1

Suponiendo que estuviera utilizando la réplica 3, cuando 2 hosts fallan, el sistema de archivos se vuelve de solo lectura y esto podría explicar lo que ve actualmente hasta cierto punto. En la mayoría de los casos, deberíamos esperar que la VM se congele ya que qemu no puede escribir en el almacenamiento, pero necesito más información al respecto, por lo que aquí se necesitan archivos de registro de los hosts.

En primer lugar, veamos que el estado se puede leer desde el almacenamiento y puede lograrlo ejecutando lo siguiente desde uno de los hosts:

hosted-engine --vm-status

Suponiendo que funcionará, intente mover el host al mantenimiento global:

hosted-engine --set-maintenance --mode=global

Si esto no funciona, significa que hay problemas para acceder al archivo de metadatos en el almacenamiento y, potencialmente, que sea de solo lectura.

Si eso funciona, la VM estará en modo de mantenimiento, lo que le permitirá verificar dentro de la VM cuál es el estado en términos de archivos y reiniciar la VM si es necesario en el mismo host.

información relacionada