
Etwa jeden Monat reagierte einer meiner Server mit VMware 4.1 nicht mehr. Die einzige Möglichkeit, ihn wieder zum Laufen zu bringen, war ein Hard-Reboot. Als dies passierte, konnte ich zwar eine Verbindung zu VMware herstellen, aber nichts anderes tun, als zu navigieren und Informationen anzuzeigen.
Der Server ist ein Dell PowerEdge R210 mit zwei 1TB SATA-Festplatten und einem Dell SAS 6/iR Adapter Raid-Controller (Spiegelung der Festplatten, keine Batterie). Ich habe einen anderen identischen Server, der ohne Probleme läuft.
Ich habe jetzt den Server ausgetauscht, um einige Tests durchführen zu können, um das herauszufinden. Bisher habe ich: BIOS und RAID-Controller-Firmware aktualisiert, VMware neu installiert, alle RAM-Module ausgetauscht, aber das behebt das Problem nicht.
Ich habe versucht, Ubuntu auf dem Server zu installieren, aber dort besteht das Problem nicht, sondern nur beim Ausführen von VMware.
Dies ist jetzt ungefähr zehnmal passiert und scheint bei hoher Festplattenlast wahrscheinlicher zu sein.
Die Fehlermeldungen lauten wie folgt:
Verbindung zum Speichergerät naa.600508e000000000a528c060b1275b09 verloren. Pfad vmhba1:C1:T0:L0 ist ausgefallen. Betroffene Datenspeicher: "", "datastore1", "Hypervisor1", "Hypervisor2", "Hypervisor3".
Aufgrund von Verbindungsproblemen ist der Zugriff auf Volume 50520233-c467e816-a5a1-0026b97a4010 (datastore1) verloren gegangen. Der Wiederherstellungsversuch ist im Gange und das Ergebnis wird in Kürze gemeldet.
Hier sind die Protokolleinträge:
Antwort1
Möglicherweise SATA-Festplatten-Timeouts. Möglicherweise haben Sie ein schlechtes oderVersagenScheibe.
Gibt es auf Ihrem PERC-Controller einen batteriegestützten Cache?