가상 환경에서 물리적 머신에 장애가 발생하면 어떻게 되나요?

가상 환경에서 물리적 머신에 장애가 발생하면 어떻게 되나요?

가상화를 시작하는 중이므로 양해해 주시기 바랍니다.

가상 환경에서 애플리케이션은 하이퍼바이저 계층에서 실행됩니다. 따라서 단일 물리적 시스템에는 여러 애플리케이션을 실행하는 여러 가상 시스템이 있을 수 있습니다.

여태까지는 그런대로 잘됐다?

그렇다면 물리적 머신에 장애가 발생하면 어떻게 될까요? 그러면 단일 시스템에서 많은 애플리케이션이 모두 실패하게 되지 않을까요?

저는 다음을 사용하여 프라이빗 클라우드를 개발하려고 합니다.오픈스택, 하지만 먼저 가상화를 완전히 이해하고 싶습니다.

답변1

구체적인 내용은 사용하는 정확한 가상화 솔루션에 따라 다르지만, 기본적으로는 각각 여러 개의 가상 머신이 있는 다수의 물리적 호스트가 있는 가상 팜이 있다는 것입니다. 그런 다음 사용일부모든 VM에 물리적 호스트가 필요하지 않아 물리적 시스템이 다운되는 경우 처리할 수 있는 오버헤드가 충분히 남아 있어 효율성을 높일 수 있습니다.

또한 공통(중복) SAN에서 각 VM의 VHD를 찾을 수 있습니다. 각 물리적 호스트의 하이퍼바이저는 서로 통신하고 다른 VM의 메모리를 공유하도록 설정할 수 있습니다. 약간의 대기 시간이 있고 대부분의 메모리가 디스크로 백업되지만 물리적 호스트 중 하나가 다운되면 해당 호스트의 VM이 다시 부팅될 때까지 기다리지도 않습니다. 대신 해당 VM은 나머지 호스트에 자동으로 배포됩니다. 궁극적인 목표는 이 기계가거의 중단했던 지점부터 다시 시작, 가동 중지 시간이 거의 또는 전혀 없습니다. 어떤 의미에서는 모든 VM이 이미 두 개 이상의 물리적 호스트에서 실행되고 있습니다. 실제로 현재 하이퍼바이저는 호스트에 장애가 발생하기 전에 마이그레이션이 완료된다는 것을 알고 있는 경우 한 번에 하나의 시스템만 이러한 종류의 마이그레이션을 수행할 수 있습니다. 하지만 실수하지 마십시오. 하드웨어 장애 시 즉각적인 마이그레이션은 모든 주요 마이그레이션의 궁극적인 목표입니다. 하이퍼바이저.

이것이 바로 팜의 단일 물리적 호스트로 가상화된 서버를 볼 수 있는 이유입니다. 하드웨어 효율성을 얻지 못할 수도 있습니다.잃다일부 성능), 관리 일관성과 내장된 고가용성 측면에서 이를 보완합니다.

답변2

호스트에 오류가 발생하면 물리적 호스트에서 실행 중인 모든 가상 서버는 오프라인 상태가 됩니다.

즉, 대부분의 플랫폼은 단일 VM에 대한 고가용성 솔루션을 제공합니다. 다른 경우에는 하나의 노드가 다운되는 경우 서비스 중단을 방지하기 위해 시스템이 여러 노드로 구축됩니다.

두 개의 VM 노드가 고가용성 서비스를 구성하는 경우 두 노드가 동일한 물리적 인프라(내결함성)에 의존하지 않도록 하이퍼바이저를 구성할 수 있습니다. 이는 지리적으로 서로 다른 위치에 이르기까지 다양한 네트워크 경로를 포함하는 물리적 서버 내결함성 이상의 것일 수 있습니다.

답변3

물리적 머신에 장애가 발생하면 VM도 사용할 수 없게 된다는 귀하의 가정은 옳습니다.

하지만 OpenStack이 이를 처리하고 실패한 물리적 서버의 VM을 다른 서버에서 시작하거나 이미 배포된 하이퍼바이저 시스템을 사용할 수 있습니다. vsphere가 그렇게 할 수 있다고 생각합니다.

당신은 읽어야합니다HA에 대한 OpenStack 문서자세한 내용은.

답변4

귀하의 질문과 관련하여 - 예, 이 물리적 호스트 내의 모든 시스템에 대한 액세스 권한이 상실됩니다. 물론 어떤 구성 요소가 실패했는지에 따라 다릅니다. 디스크라면 문제가 되고, 마더보드라면 훨씬 쉽습니다. 일반적으로 하이퍼바이저는 하드웨어에 구애받지 않으므로 하드웨어 복구가 더 쉽습니다. 현재로서는 고가용성 서비스를 제공하는 데 사용할 수 있는 공급업체별 기술이 많이 있습니다.

리소스 풀(vmware) - 는아니다위에서 언급한 것처럼 여러 물리적 호스트 리소스(CPU, 메모리 등)를 집계할 수 있으므로 물리적 호스트가 2개 있는 경우(하이퍼스레딩이 없는 1CPU 쿼드 코어 - 각각 8GBRAM)아니다거기에 5vCPU-12Gb VM이 있을 수 있습니다. 리소스 풀은 논리적 풀이므로 슈퍼컴퓨팅 시스템을 만들 수 없습니다. 현재 이는 리소스 활용도를 제어하는 ​​방법입니다.

유효성(vmware) - 다음과 같은 기술을 사용할 수 있습니다.고가용성(HA) 자동화된 복구 기능을 제공합니다(내 경험을 토대로).1~2분)을 자동으로 삭제합니다. 스토리지 어레이(NAS,iSCSI,FC)를 사용하고 모든 VM 파일을 여기에 보관하는 경우입니다. HA는 CPU, RAM, 마더보드에 장애가 발생한 경우에만 작동하므로 스토리지 어레이가 다운되면 작동하지 않을 것이 분명합니다. RAID/컨트롤러 오류를 방지하기 위해 사람들은 복제, 스토리지 LUN 미러링 등을 사용합니다.

1~2분 이내에 복구하는 것이 불가능하다면 다음과 같은 기술이 있습니다.결함 허용(FT) 구성된 VM의 섀도(실행) 복사본을 유지하여 장애 발생 시 VM의 가동 중지 시간을 0으로 달성할 수 있습니다. 그러나 이 기술에는 많은 제한 사항도 있습니다. 여러 vCPU가 있는 VM의 내결함성 문제는 완전히 해결되지 않았습니다.

전반적으로 각 솔루션은 목표에 따라 다릅니다.

관련 정보