Estoy ejecutando VMWare Server 2.0.2 (compilación 203138) en un Intel i5 de doble núcleo con sistema Ubuntu Server 10.04 LTS (kernel 2.6.32-22-server #33-Ubuntu SMP
). Disk Subsystem es una matriz RAID5 de software.
El sistema lleva poco más de una semana instalado. Durante los últimos 5 días he estado ejecutando al menos 3 máquinas virtuales (Linux y una variedad de sistemas operativos Windows) sin ningún problema. Pero mientras estaba instalando Linux en una nueva máquina virtual, de repente todas las máquinas virtuales dejaron de responder, incluida aquella en la que estaba instalando. No pude iniciar sesión en la interfaz de administración de VMWare y el sistema no respondía a través de SSH. Cuando miré top
, vi:
top - 16:14:51 up 6 days, 1:49, 8 users, load average: 24.29, 24.33 17.54
Tasks: 203 total, 7 running, 195 sleeping, 0 stopped, 1 zombie
Cpu(s): 0.2%us, 25.6%sy, 0.0%ni, 74.3%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 8056656k total, 5927580k used, 2129076k free, 20320k buffers
Swap: 7811064k total, 240216k used, 7570848k free, 5045884k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
21549 root 39 19 0 0 0 Z 100 0.0 15:02.44 [vmware-vmx] <defunct>
2115 root 20 0 0 0 0 S 1 0.0 170:32.08 [vmware-rtc]
2231 root 21 1 1494m 126m 100m S 1 1.6 892:58.05 /usr/lib/vmware/bin/vmware-vmx -# product=2;
2280 jnet 20 0 19320 1164 800 R 0 0.0 30:04.55 top
12236 root 20 0 833m 41m 34m S 0 0.5 88:34.24 /usr/lib/vmware/bin/vmware-vmx -# product=2;
1 root 20 0 23704 1476 920 S 0 0.0 0:00.80 /sbin/init
2 root 20 0 0 0 0 S 0 0.0 0:00.01 [kthreadd]
3 root RT 0 0 0 0 S 0 0.0 0:00.00 [migration/0]
4 root 20 0 0 0 0 S 0 0.0 0:00.84 [ksoftirqd/0]
5 root RT 0 0 0 0 S 0 0.0 0:00.00 [watchdog/0]
6 root RT 0 0 0 0 S 0 0.0 0:00.00 [migration/1]
El proceso VMWare de la máquina virtual en la que estaba instalando se convirtió en un zombie. Sin embargo, todavía consumía el 100% del tiempo de la CPU en uno de los núcleos y no podía acceder a él ni a ninguna otra máquina virtual. (Inicié sesión en una máquina virtual a través de SSH, otra a través de X11 y una tercera a través de VNC. Las tres conexiones murieron). Cuando ejecuté ps -ef
comandos similares, descubrí que el vmware-vmx
proceso inactivo tenía su PID principal configurado en init
(1). También utilicé lsof -p 21549
y descubrí que el proceso desaparecido no tenía archivos abiertos. Sin embargo, estaba usando el 100% del tiempo de la CPU...
no pude matarcualquier vmware-vmx
procesos, incluido el extinto, incluso con kill -9
. Como último recurso para resolver la situación, intenté reiniciar la caja, sin embargo , shutdown
y no se pudo reiniciar/apagar, incluso cuando se les dieron las configuraciones adecuadas. produjo un mensaje acerca de reiniciar en la consola, pero el sistema no se reinicia. Tuve que apagar y encender la caja para resolver la situación. (Ver mi otra pregunta,halt
reboot
init 6
--force
ControlAltDel¿Debo preocuparme por la integridad de mi software RAID5 de Linux después de una falla o pánico del kernel?)
¿Qué causaría un escenario como este? ¿Qué más podría haber hecho para resolverlo además de un reinicio completo? ¿Qué puedo hacer para prevenir una situación así en el futuro?
Respuesta1
Consulte esta publicación del foro de VMWare y vea si le ayuda: http://communities.vmware.com/message/531884#531884
Deshabilitar el uso compartido de memoria es una buena idea en general si tienes RAM.
He compilado algunas optimizaciones que uso para VMWare Server 2 en Ubuntu aquí: http://www.stress-free.co.nz/vmware_server_20_optimisations
Nunca he experimentado el problema que usted describió y estoy ejecutando servidores de producción con Ubuntu Server 8.04LTS y 10.04LTS (tanto de 32 bits como de 64 bits).
Respuesta2
Lamentablemente nunca pude encontrar una solución a este problema. Simplemente parecía ser un problema inherente a VMware Server.
Desde entonces, hemos migrado a VMWare ESXi. ¡Es muchísimo mejor, no hay comparación! Nunca he tenido problemas similares con ESXi.