KVM을 사용하여 여러 가상 머신을 실행하는 서버가 있습니다. 잘 작동하지만 해당 물리적 서버 하나에서 잠재적인 하드웨어 오류가 발생할까 걱정됩니다.
우리는 밤마다 다른 물리적 서버에 백업을 수행하지만 백업을 복원하는 데 시간이 걸립니다. 전체 시스템이 망가지면 몇 시간의 가동 중지 시간이 발생합니다.
우리는 어느 시점에서 메인 서버에 장애가 발생하는 경우 전환할 수 있는 장애 복구 시스템(즉, 다른 물리적 서버)을 갖고 싶습니다.
이에 관해 몇 가지 질문이 있습니다.
- 장애 조치 시스템을 기본 시스템과 미러링하려면 어떻게 해야 합니까? 단일 하드웨어 오류로 인해 모든 것이 종료되지 않도록 하려면 서로 다른 물리적 시스템을 사용해야 합니다. 네트워크를 통한 RAID 1과 같은 소프트웨어가 있습니까? 이것이 로드 밸런싱과 관련이 있나요?
- 기본 시스템이 응답하지 않는 경우 장애 조치 시스템에 요청을 어떻게 전달합니까? 제때에 응답하지 않으면 정기적으로 핑을 수행하고 DNS 정보를 업데이트해야 합니까?
- 가상 머신 수준에서 작동할 수 있는 기능이 있으면 좋을 것입니다. 즉, 단일 가상 머신이 다운된 경우 해당 머신에 대한 요청이 장애 조치 시스템의 복사본으로 전달되어야 합니다.
답변1
귀하의 시나리오에 가장 적합한 솔루션 중 하나는 DRBD+Heartbeat입니다. DRBD는 서버 간 디스크/파티션/LV를 실시간으로 복제합니다. I/O가 많은 서버에는 권장되지 않지만 중소 규모 환경에서는 매우 잘 작동합니다.
문서는 매우 훌륭합니다. 사이트를 살펴보십시오. 예제와 바로 사용할 수 있는 솔루션이 포함된 "DRBD 지원 애플리케이션"이라는 섹션이 있습니다. "DRBD와 함께 Xen 사용"을 기본으로 KVM에 적용할 수 있습니다.
나는 이 솔루션을 갖춘 많은 서버를 보유하고 있으며 완벽하게 작동합니다.