VMWare가 사라진 이유는 무엇입니까? 어떻게 복구/방지할 수 있나요?

VMWare가 사라진 이유는 무엇입니까? 어떻게 복구/방지할 수 있나요?

저는 Ubuntu Server 10.04 LTS 시스템(커널)을 갖춘 듀얼 코어 Intel i5에서 VMWare Server 2.0.2(빌드 203138)를 실행하고 있습니다 2.6.32-22-server #33-Ubuntu SMP. 디스크 하위 시스템은 소프트웨어 RAID5 어레이입니다.

시스템이 구축된 지 일주일이 조금 넘었습니다. 지난 5일 동안 저는 3개 이상의 VM(Linux 및 다양한 Windows OS)을 아무런 문제 없이 실행해 왔습니다. 그러나 새 VM에 Linux를 설치하는 동안 갑자기 설치하려는 VM을 포함하여 모든 VM이 응답하지 않게 되었습니다. VMWare 관리 인터페이스에 로그인할 수 없었고 시스템이 SSH를 통해 다소 응답하지 않았습니다. 을(를) 보면 다음과 top같습니다.

top - 16:14:51 up 6 days,  1:49,  8 users,  load average: 24.29, 24.33 17.54
Tasks: 203 total,   7 running, 195 sleeping,   0 stopped,   1 zombie
Cpu(s):  0.2%us, 25.6%sy,  0.0%ni, 74.3%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:   8056656k total,  5927580k used,  2129076k free,    20320k buffers
Swap:  7811064k total,   240216k used,  7570848k free,  5045884k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                                                                                                                                                               
21549 root      39  19     0    0    0 Z  100  0.0  15:02.44 [vmware-vmx] <defunct>
 2115 root      20   0     0    0    0 S    1  0.0 170:32.08 [vmware-rtc]
 2231 root      21   1 1494m 126m 100m S    1  1.6 892:58.05 /usr/lib/vmware/bin/vmware-vmx -# product=2;                                                                                                                                                                                       
 2280 jnet      20   0 19320 1164  800 R    0  0.0  30:04.55 top 
12236 root      20   0  833m  41m  34m S    0  0.5  88:34.24 /usr/lib/vmware/bin/vmware-vmx -# product=2;
    1 root      20   0 23704 1476  920 S    0  0.0   0:00.80 /sbin/init                                                                                                                                                                                             
    2 root      20   0     0    0    0 S    0  0.0   0:00.01 [kthreadd]                                                                                                                                                                                             
    3 root      RT   0     0    0    0 S    0  0.0   0:00.00 [migration/0]                                                                                                                                                                                          
    4 root      20   0     0    0    0 S    0  0.0   0:00.84 [ksoftirqd/0]                                                                                                                                                                                          
    5 root      RT   0     0    0    0 S    0  0.0   0:00.00 [watchdog/0]                                                                                                                                                                                           
    6 root      RT   0     0    0    0 S    0  0.0   0:00.00 [migration/1]                                                                                                                                                                                          

내가 설치하고 있던 가상 머신의 VMWare 프로세스가 좀비가 되었습니다. 그러나 여전히 코어 중 하나에서 CPU 시간을 100% 소비하고 있었고 코어나 다른 가상 머신에 접근할 수 없었습니다. (SSH를 통해 하나의 가상 머신에 로그인했고, 다른 하나는 X11을 통해, 세 번째는 VNC를 통해 로그인했습니다. 세 개의 연결이 모두 끊어졌습니다.) 유사한 명령을 실행했을 때 존재하지 않는 프로세스의 상위 PID가 (1) 로 설정되어 있음 ps -ef을 발견했습니다 . 나는 또한 존재하지 않는 프로세스에 열린 파일이 없다는 것을 사용하고 발견했습니다. 그런데 CPU 시간을 100% 사용하고 있었습니다...vmware-vmxinitlsof -p 21549

죽이지는 못했어요어느 vmware-vmx. kill -9​상황을 해결하기 위한 최후의 수단으로 상자를 재부팅하려고 시도했지만 적절한 설정이 주어졌음에도 불구하고 shutdown, halt, rebootinit 6모두 재부팅/종료에 실패했습니다 --force. ControlAltDel콘솔 재부팅에 대한 메시지가 표시되었지만 시스템이 재부팅되지 않았습니다. 상황을 해결하려면 상자의 전원을 껐다 켜야 했습니다. (내 다른 질문을 참조하세요.충돌이나 커널 패닉 이후 Linux 소프트웨어 RAID5의 무결성에 대해 걱정해야 합니까?)

이와 같은 시나리오의 원인은 무엇입니까? 하드 재부팅 외에 이 문제를 해결하기 위해 무엇을 할 수 있었습니까? 앞으로 이런 상황을 방지하려면 어떻게 해야 합니까?

답변1

이 VMWare 포럼 게시물을 확인하고 도움이 되는지 확인하세요. http://communities.vmware.com/message/531884#531884

RAM이 있는 경우 일반적으로 메모리 공유를 비활성화하는 것이 좋습니다.

Ubuntu의 VMWare Server 2에 사용하는 몇 가지 최적화를 여기에 정리했습니다. http://www.stress-free.co.nz/vmware_server_20_optimisations

저는 귀하가 설명한 문제를 경험한 적이 없으며 Ubuntu Server 8.04LTS 및 10.04LTS(32비트 및 64비트 모두)가 설치된 프로덕션 서버를 실행하고 있습니다.

답변2

불행히도 나는 이 문제에 대한 해결책을 찾지 못했습니다. 이는 VMware Server 고유의 문제인 것 같습니다.

이후 VMWare ESXi로 마이그레이션했습니다. 세상이 더 좋습니다. 비교할 수 없습니다! ESXi와 비슷한 문제가 발생한 적이 없습니다.

관련 정보