
Hace aproximadamente un año instalé un ESXi 5.5 para virtualizar un antiguo servidor físico de Windows 2000 que, desafortunadamente, no se puede actualizar/migrar/reemplazar fácilmente. El almacén de datos principal de ESXi se creó sobre una matriz RAID5 construida alrededor de discos SATA internos de 4x2TB.
Una vez convertido, ejecuto pasos de desinfección comunes, incluida la instalación de VMware Tools adecuadas.
Inmediatamente después de W2K, se definieron otro par de máquinas virtuales en el mismo ESXi, incluida una máquina virtual CentOS que, al igual que W2K, se ejecuta 24 horas al día, 7 días a la semana, 365 días al año.
He configurado el "Inicio/Apagado de la máquina virtual" para que todas las máquinas virtuales deban iniciarse manualmente, después de reiniciar el hipervisor.
Todo está funcionando correctamente, con sólo una excepción: si el hipervisor sufre un corte de energía (mientras las VM están encendidas), mientras la VM CentOS se "encender" en segundos,la VM W2K tarda más de una hora. Por favor tenga en cuenta que soynohablando del tiempo que requiere Windows 2000 para completar el proceso de arranque. Me refiero al tiempo que requiere ESXi para iniciar la VM. En detalle:
tiempo t0: se inicia el hipervisor, después de un corte de energía;
...esperando un tiempo sólo para estar seguro de que ESXi completó correctamente su propio proceso de arranque...
tiempo t1: haga clic derecho en W2K VM => Encendido => Encendido
... aparece el mensaje "El nombre de la máquina virtual está comenzando" en el área de notificación, con la barra de progreso pasando del 0 al 45% en aproximadamente 1 segundo...
...el mensaje "El nombre de la máquina virtual está comenzando" permanece ahí, fijo en 45%, durante aproximadamente 80 (¡ochenta!) minutos, o incluso más...
...la barra de progreso de repente pasa del 45% al 100%...
...aparece el mensaje "La máquina virtual está encendida" en el área de notificación...
hora t2: la consola VM comienza a mostrar que W2K inició el proceso de arranque
...se necesitan dos/tres minutos para que W2K complete su propio proceso de arranque...
Hora t3: Los servicios W2K están disponibles en la red.
Permítanme insistir en decir que entre t1 y t2 (y no entre t2 y t3) se emplean 80 minutos.
A continuación puede encontrar algunos números reales, tomados del corte de energía de hoy (... ¡y sí! No hay ningún UPS protegiendo dicho servidor. ¡Por favor, sean amables y no pidan detalles!):
Como podéis comprobar por vosotros mismos:
- la energía volvió justo antes de las 17:21;
- ESXi completó el arranque alrededor de las 17:21;
- Hice el "Encendido" a las 18:41:53;
- ESXi me dijo que la VM se encendió a las 20:15:51;
- al mismo tiempo (20:15:51) ESXi se quejó de que las herramientas de VMware no estaban instaladas en la VM
En cuanto a este último punto (faltan herramientas VMware), están correctamente instaladas, como puedes ver a continuación:
Tenga en cuenta que dicho retraso esnoregistrado en la máquina virtual CentOS: se enciende, mediante ESXi, dentro de un par de segundos desde la solicitud de "Encendido".
Sospeché que ESXi va a realizar una especie de "verificación de cordura" del sistema de archivos que aloja los datos de la VM y, como lo ha hecho la VM W2K:
- disco1: 67 GB
- disco2: 1 GB
- disco3: 610 GB
- disco4: 360 GB
- disco5: 1,9TB
Probablemente lleve mucho tiempo comprobarlo todo. Intenté verificar, a través de la consola ESXi, si se estaba ejecutando algún proceso "similar a fsck", pero encontrénada. También busqué archivos de registro pero... no pude encontrar nada relevante.
Además: si el corte de energía ocurre cuando la VM está apagada, entonces se registra un encendido normal y rápido y todo lo anterior ocurre.noaplicar.
Entonces la pregunta es: ¿alguien tiene idea de cuál es el problema y cómo puedo solucionarlo?
Actualización 1:
Parece que ESXi necesita mucho tiempo para "abrir discos". Acabo de encontrar esto:
~ # grep took /vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/vmware.log
2015-08-21T18:15:51.282Z| vmx| I120: DISK: Opening disks took 5636937 ms.
¡Y 5636937 ms son exactamente 93 minutos!
Justo encima de ese logline veo detalles para cada uno de los 5 discos (Las líneas que comienzan con # han sido agregadas por mí, para aclaración.):
# server_2k_COMPANY_1-000003.vmdk => DISK 2 - 1 GB
2015-08-21T16:41:54.613Z| Worker#1| I120: DISKLIB-LIB : Opened "/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_1-000003.vmdk" (flags 0xa, type vmfs).
2015-08-21T16:41:54.613Z| Worker#1| I120: DISK: Disk '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_1-000003.vmdk' has UUID '60 00 c2 93 75 e2 fd 3d-40 43 f8 25 f0 5a b8 9b'
2015-08-21T16:41:54.613Z| Worker#1| I120: DISK: OPEN '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_1-000003.vmdk' Geo (517/128/32) BIOS Geo (0/0/0)
#
# server_2k_COMPANY-000003.vmdk => DISK 1 - 67 GB
2015-08-21T16:43:40.637Z| Worker#0| I120: DISKLIB-LIB : Opened "/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY-000003.vmdk" (flags 0xa, type vmfs).
2015-08-21T16:43:40.637Z| Worker#0| I120: DISK: Disk '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY-000003.vmdk' has UUID '60 00 c2 9a 0a c0 10 79-6e 68 52 0d 0d 7a 23 cb'
2015-08-21T16:43:40.637Z| Worker#0| I120: DISK: OPEN '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY-000003.vmdk' Geo (8844/255/63) BIOS Geo (0/0/0)
#
# server_2k_COMPANY_3-000003.vmdk => DISK 4 - 360 GB
2015-08-21T16:45:28.355Z| Worker#3| I120: DISKLIB-LIB : Opened "/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_3-000003.vmdk" (flags 0xa, type vmfs).
2015-08-21T16:45:28.355Z| Worker#3| I120: DISK: Disk '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_3-000003.vmdk' has UUID '60 00 c2 95 13 e3 ad 8d-62 5f 94 12 52 53 de 82'
2015-08-21T16:45:28.355Z| Worker#3| I120: DISK: OPEN '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_3-000003.vmdk' Geo (47834/255/63) BIOS Geo (0/0/0)
#
# server_2k_COMPANY_2-000003.vmdk => DISK 3 - 610GB
2015-08-21T17:09:00.957Z| Worker#2| I120: DISKLIB-LIB : Opened "/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_2-000003.vmdk" (flags 0xa, type vmfs).
2015-08-21T17:09:00.957Z| Worker#2| I120: DISK: Disk '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_2-000003.vmdk' has UUID '60 00 c2 9d 4d d2 57 e6-da 9e 1b 8c 54 ab 39 62'
2015-08-21T17:09:00.957Z| Worker#2| I120: DISK: OPEN '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_2-000003.vmdk' Geo (79736/255/63) BIOS Geo (0/0/0)
#
# server_2k_COMPANY_4-000001.vmdk => DISK 5 - 1,9 TB
2015-08-21T18:15:51.268Z| vmx| I120: DISKLIB-LIB : Opened "/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_4-000001.vmdk" (flags 0xa, type vmfs).
2015-08-21T18:15:51.269Z| vmx| I120: DISK: Disk '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_4-000001.vmdk' has UUID '60 00 c2 91 b1 7d cd 92-c5 13 e7 aa fc 81 b1 33'
2015-08-21T18:15:51.269Z| vmx| I120: DISK: OPEN '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_4-000001.vmdk' Geo (253981/255/63) BIOS Geo (0/0/0)
#
2015-08-21T18:15:51.282Z| vmx| I120: DISK: Opening disks took 5636937 ms.
Entonces fue necesario:
- 2 minutos para abrir DISK1 (67 GB);
- 2 minutos para abrir DISK4 (360 GB);
- 24 minutos para abrir DISK3 (610 GB);
- 66 minutos para abrir DISK5 (1,9TB);
Me pregunto por qué DISK3 y DISK5 consumieron tanto tiempo.
En cuanto a las instantáneas, aquí abajo podéis ver el estado actual: