
Vor etwa einem Jahr habe ich ESXi 5.5 installiert, um einen alten physischen Windows 2000-Server zu virtualisieren, der leider nicht einfach aktualisiert/migriert/ersetzt werden kann. Der Haupt-ESXi-Datenspeicher wurde auf einem RAID5-Array erstellt, das auf 4x2TB internen SATA-Festplatten basiert.
Nach der Konvertierung führe ich die üblichen Bereinigungsschritte aus, einschließlich der Installation der entsprechenden VMware Tools.
Direkt nach dem W2K wurden auf demselben ESXi noch einige weitere VMs definiert, darunter eine CentOS-VM, die wie beim W2K rund um die Uhr an 365 Tagen im Jahr läuft.
Ich habe das „Starten/Herunterfahren virtueller Maschinen“ so konfiguriert, dass alle VMs nach einem Neustart des Hypervisors manuell gestartet werden müssen.
Alles läuft einwandfrei, mit nur einer Ausnahme: Wenn der Hypervisor einen Stromausfall erleidet (während die VMs eingeschaltet sind), während die CentOS-VM innerhalb von Sekunden „eingeschaltet“ wird,die W2K VM dauert mehr als eine Stunde. Bitte beachten Sie, dass ichnichtIch spreche von der Zeit, die Windows 2000 benötigt, um den Startvorgang abzuschließen. Ich spreche von der Zeit, die ESXi benötigt, um die VM zu starten. Im Detail:
Zeitpunkt t0: Hypervisor wird nach einem Stromausfall gestartet;
... einige Zeit warten, nur um sicherzugehen, dass ESXi seinen eigenen Startvorgang ordnungsgemäß abgeschlossen hat ...
Zeit t1: Rechtsklick auf W2K VM => Power => Einschalten
...im Benachrichtigungsbereich wird die Meldung „VM-Name wird gestartet“ angezeigt, wobei der Fortschrittsbalken in etwa 1 Sekunde von 0 auf 45 % springt ...
...die Meldung „VM-Name wird gestartet“ bleibt dort, fest auf 45 %, für etwa 80 (achtzig!) Minuten oder sogar länger ...
...der Fortschrittsbalken springt plötzlich von 45 % auf 100 %...
...die Meldung „VM ist eingeschaltet“ erscheint im Benachrichtigungsbereich...
Zeitpunkt t2: VM-Konsole startet und zeigt an, dass W2K den Bootvorgang gestartet hat
...W2K benötigt zwei bis drei Minuten, um den Bootvorgang abzuschließen...
Zeitpunkt t3: W2K-Dienste sind im Netzwerk verfügbar.
Ich möchte darauf hinweisen, dass zwischen t1 und t2 (und nicht zwischen t2 und t3) 80 Minuten liegen.
Nachfolgend finden Sie einige tatsächliche Zahlen, die dem heutigen Stromausfall entnommen wurden (... und ja! Es gibt keine USV, die einen solchen Server schützt. Bitte seien Sie so nett und fragen Sie nicht nach Einzelheiten!):
Wie Sie selbst sehen können:
- der Strom war kurz vor 17:21 Uhr wieder da;
- ESXi hat den Bootvorgang gegen 17:21 abgeschlossen;
- Das „Power on“ habe ich um 18:41:53 gemacht;
- ESXi teilte mir mit, dass die VM um 20:15:51 eingeschaltet wurde;
- gleichzeitig (20:15:51) beschwerte sich ESXi, dass VMware-Tools auf der VM nicht installiert waren
Was den letzten Punkt (fehlende VMware-Tools) betrifft, sind sie ordnungsgemäß installiert, wie Sie unten sehen können:
Bitte beachten Sie, dass eine solche Verzögerungnichtauf der CentOS-VM registriert: Sie wird von ESXi innerhalb weniger Sekunden nach der „Power On“-Anforderung eingeschaltet.
Ich vermutete, dass ESXi eine Art „Sanity Check“ des Dateisystems durchführen wird, das die VM-Daten hostet, und da die W2K-VM Folgendes getan hat:
- Festplatte 1: 67 GB
- Festplatte2: 1 GB
- Festplatte 3: 610 GB
- Festplatte 4: 360 GB
- Festplatte 5: 1,9 TB
wahrscheinlich braucht es viel Zeit, alles zu überprüfen. Ich habe versucht, über die ESXi-Konsole zu prüfen, ob ein "fsck-ähnlicher" Prozess läuft, aber festgestelltNichts. Ich habe auch nach Protokolldateien gesucht, aber ... nichts Relevantes finden können.
Außerdem: Wenn der Stromausfall auftritt, während die VM ausgeschaltet ist, wird ein normales, schnelles Einschalten registriert und alle oben genanntennichtanwenden.
Die Frage ist also: Hat jemand eine Ahnung, wo das Problem liegt und wie ich es lösen oder beheben kann?
Aktualisierung 1:
Es sieht so aus, als bräuchte ESXi viel Zeit zum „Öffnen von Festplatten“. Ich habe gerade Folgendes gefunden:
~ # grep took /vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/vmware.log
2015-08-21T18:15:51.282Z| vmx| I120: DISK: Opening disks took 5636937 ms.
und 5636937 ms sind genau 93 Minuten!
Direkt über dieser Logzeile sehe ich Details zu jeder der 5 Festplatten (Zeilen, die mit # beginnen, wurden von mir zur Verdeutlichung hinzugefügt):
# server_2k_COMPANY_1-000003.vmdk => DISK 2 - 1 GB
2015-08-21T16:41:54.613Z| Worker#1| I120: DISKLIB-LIB : Opened "/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_1-000003.vmdk" (flags 0xa, type vmfs).
2015-08-21T16:41:54.613Z| Worker#1| I120: DISK: Disk '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_1-000003.vmdk' has UUID '60 00 c2 93 75 e2 fd 3d-40 43 f8 25 f0 5a b8 9b'
2015-08-21T16:41:54.613Z| Worker#1| I120: DISK: OPEN '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_1-000003.vmdk' Geo (517/128/32) BIOS Geo (0/0/0)
#
# server_2k_COMPANY-000003.vmdk => DISK 1 - 67 GB
2015-08-21T16:43:40.637Z| Worker#0| I120: DISKLIB-LIB : Opened "/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY-000003.vmdk" (flags 0xa, type vmfs).
2015-08-21T16:43:40.637Z| Worker#0| I120: DISK: Disk '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY-000003.vmdk' has UUID '60 00 c2 9a 0a c0 10 79-6e 68 52 0d 0d 7a 23 cb'
2015-08-21T16:43:40.637Z| Worker#0| I120: DISK: OPEN '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY-000003.vmdk' Geo (8844/255/63) BIOS Geo (0/0/0)
#
# server_2k_COMPANY_3-000003.vmdk => DISK 4 - 360 GB
2015-08-21T16:45:28.355Z| Worker#3| I120: DISKLIB-LIB : Opened "/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_3-000003.vmdk" (flags 0xa, type vmfs).
2015-08-21T16:45:28.355Z| Worker#3| I120: DISK: Disk '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_3-000003.vmdk' has UUID '60 00 c2 95 13 e3 ad 8d-62 5f 94 12 52 53 de 82'
2015-08-21T16:45:28.355Z| Worker#3| I120: DISK: OPEN '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_3-000003.vmdk' Geo (47834/255/63) BIOS Geo (0/0/0)
#
# server_2k_COMPANY_2-000003.vmdk => DISK 3 - 610GB
2015-08-21T17:09:00.957Z| Worker#2| I120: DISKLIB-LIB : Opened "/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_2-000003.vmdk" (flags 0xa, type vmfs).
2015-08-21T17:09:00.957Z| Worker#2| I120: DISK: Disk '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_2-000003.vmdk' has UUID '60 00 c2 9d 4d d2 57 e6-da 9e 1b 8c 54 ab 39 62'
2015-08-21T17:09:00.957Z| Worker#2| I120: DISK: OPEN '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_2-000003.vmdk' Geo (79736/255/63) BIOS Geo (0/0/0)
#
# server_2k_COMPANY_4-000001.vmdk => DISK 5 - 1,9 TB
2015-08-21T18:15:51.268Z| vmx| I120: DISKLIB-LIB : Opened "/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_4-000001.vmdk" (flags 0xa, type vmfs).
2015-08-21T18:15:51.269Z| vmx| I120: DISK: Disk '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_4-000001.vmdk' has UUID '60 00 c2 91 b1 7d cd 92-c5 13 e7 aa fc 81 b1 33'
2015-08-21T18:15:51.269Z| vmx| I120: DISK: OPEN '/vmfs/volumes/54b687a6-e5de9210-27fe-549f35062eb4/server_2k_COMPANY/server_2k_COMPANY_4-000001.vmdk' Geo (253981/255/63) BIOS Geo (0/0/0)
#
2015-08-21T18:15:51.282Z| vmx| I120: DISK: Opening disks took 5636937 ms.
Es dauerte also:
- 2 Minuten zum Öffnen von DISK1 (67 GB);
- 2 Minuten zum Öffnen von DISK4 (360 GB);
- 24 Minuten zum Öffnen von DISK3 (610 GB);
- 66 Minuten zum Öffnen von DISK5 (1,9 TB);
Ich frage mich, warum DISK3 und DISK5 so zeitaufwändig waren.
Was die Schnappschüsse betrifft, können Sie hier unten den aktuellen Status sehen: