¿Por qué VMWare desaparecería? ¿Cómo recuperarse/prevenirlo?

¿Por qué VMWare desaparecería? ¿Cómo recuperarse/prevenirlo?

Estoy ejecutando VMWare Server 2.0.2 (compilación 203138) en un Intel i5 de doble núcleo con sistema Ubuntu Server 10.04 LTS (kernel 2.6.32-22-server #33-Ubuntu SMP). Disk Subsystem es una matriz RAID5 de software.

El sistema lleva poco más de una semana instalado. Durante los últimos 5 días he estado ejecutando al menos 3 máquinas virtuales (Linux y una variedad de sistemas operativos Windows) sin ningún problema. Pero mientras estaba instalando Linux en una nueva máquina virtual, de repente todas las máquinas virtuales dejaron de responder, incluida aquella en la que estaba instalando. No pude iniciar sesión en la interfaz de administración de VMWare y el sistema no respondía a través de SSH. Cuando miré top, vi:

top - 16:14:51 up 6 days,  1:49,  8 users,  load average: 24.29, 24.33 17.54
Tasks: 203 total,   7 running, 195 sleeping,   0 stopped,   1 zombie
Cpu(s):  0.2%us, 25.6%sy,  0.0%ni, 74.3%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:   8056656k total,  5927580k used,  2129076k free,    20320k buffers
Swap:  7811064k total,   240216k used,  7570848k free,  5045884k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                                                                                                                                                               
21549 root      39  19     0    0    0 Z  100  0.0  15:02.44 [vmware-vmx] <defunct>
 2115 root      20   0     0    0    0 S    1  0.0 170:32.08 [vmware-rtc]
 2231 root      21   1 1494m 126m 100m S    1  1.6 892:58.05 /usr/lib/vmware/bin/vmware-vmx -# product=2;                                                                                                                                                                                       
 2280 jnet      20   0 19320 1164  800 R    0  0.0  30:04.55 top 
12236 root      20   0  833m  41m  34m S    0  0.5  88:34.24 /usr/lib/vmware/bin/vmware-vmx -# product=2;
    1 root      20   0 23704 1476  920 S    0  0.0   0:00.80 /sbin/init                                                                                                                                                                                             
    2 root      20   0     0    0    0 S    0  0.0   0:00.01 [kthreadd]                                                                                                                                                                                             
    3 root      RT   0     0    0    0 S    0  0.0   0:00.00 [migration/0]                                                                                                                                                                                          
    4 root      20   0     0    0    0 S    0  0.0   0:00.84 [ksoftirqd/0]                                                                                                                                                                                          
    5 root      RT   0     0    0    0 S    0  0.0   0:00.00 [watchdog/0]                                                                                                                                                                                           
    6 root      RT   0     0    0    0 S    0  0.0   0:00.00 [migration/1]                                                                                                                                                                                          

El proceso VMWare de la máquina virtual en la que estaba instalando se convirtió en un zombie. Sin embargo, todavía consumía el 100% del tiempo de la CPU en uno de los núcleos y no podía acceder a él ni a ninguna otra máquina virtual. (Inicié sesión en una máquina virtual a través de SSH, otra a través de X11 y una tercera a través de VNC. Las tres conexiones murieron). Cuando ejecuté ps -efcomandos similares, descubrí que el vmware-vmxproceso inactivo tenía su PID principal configurado en init(1). También utilicé lsof -p 21549y descubrí que el proceso desaparecido no tenía archivos abiertos. Sin embargo, estaba usando el 100% del tiempo de la CPU...

no pude matarcualquier vmware-vmxprocesos, incluido el extinto, incluso con kill -9. Como último recurso para resolver la situación, intenté reiniciar la caja, sin embargo , shutdowny no se pudo reiniciar/apagar, incluso cuando se les dieron las configuraciones adecuadas. produjo un mensaje acerca de reiniciar en la consola, pero el sistema no se reinicia. Tuve que apagar y encender la caja para resolver la situación. (Ver mi otra pregunta,haltrebootinit 6--forceControlAltDel¿Debo preocuparme por la integridad de mi software RAID5 de Linux después de una falla o pánico del kernel?)

¿Qué causaría un escenario como este? ¿Qué más podría haber hecho para resolverlo además de un reinicio completo? ¿Qué puedo hacer para prevenir una situación así en el futuro?

Respuesta1

Consulte esta publicación del foro de VMWare y vea si le ayuda: http://communities.vmware.com/message/531884#531884

Deshabilitar el uso compartido de memoria es una buena idea en general si tienes RAM.

He compilado algunas optimizaciones que uso para VMWare Server 2 en Ubuntu aquí: http://www.stress-free.co.nz/vmware_server_20_optimisations

Nunca he experimentado el problema que usted describió y estoy ejecutando servidores de producción con Ubuntu Server 8.04LTS y 10.04LTS (tanto de 32 bits como de 64 bits).

Respuesta2

Lamentablemente nunca pude encontrar una solución a este problema. Simplemente parecía ser un problema inherente a VMware Server.

Desde entonces, hemos migrado a VMWare ESXi. ¡Es muchísimo mejor, no hay comparación! Nunca he tenido problemas similares con ESXi.

información relacionada