KVM с настройкой отказоустойчивости

KVM с настройкой отказоустойчивости

У нас есть сервер, на котором запущено несколько виртуальных машин с использованием KVM. Хотя он работает хорошо, мы обеспокоены возможными сбоями оборудования на этом физическом сервере.

Мы делаем резервное копирование каждую ночь на другой физический сервер, но восстановление резервных копий занимает некоторое время. Если бы вся система сгорела, у нас было бы несколько часов простоя.

Нам бы хотелось иметь систему аварийного переключения (т. е. другой физический сервер), на которую мы могли бы переключиться, если основной сервер в какой-то момент выйдет из строя.

У меня есть несколько вопросов по этому поводу:

  • Как бы мы сделали систему отказоустойчивости зеркалом основной? Это должны быть разные физические машины, чтобы мы могли быть уверены, что один отказ оборудования не убьет все. Существует ли программное обеспечение для чего-то вроде RAID 1 по сети? Это как-то связано с балансировкой нагрузки?
  • Как мы будем отправлять запросы на резервную машину, если основная не отвечает? Должны ли мы регулярно пинговать ее и обновлять информацию DNS, если она не отвечает вовремя?
  • Было бы здорово иметь что-то, что работало бы на уровне виртуальной машины, то есть если одна виртуальная машина вышла из строя, запросы к ней перенаправлялись бы на копию в системе аварийного переключения.

решение1

Одним из лучших решений для вашего сценария является DRBD+Heartbeat. DRBD реплицирует диски/разделы/LV между серверами в реальном времени. Это не рекомендуется для серверов с большим количеством операций ввода-вывода, но очень хорошо работает для небольших и средних сред.

Документация очень хорошая, посмотрите на сайте. Есть раздел "DRBD-enabled applications" с примерами и готовыми решениями. Вы можете использовать "Using Xen with DRBD" как основу, адаптировав его к KVM.

У меня есть много серверов с этим решением, и оно работает идеально.

Связанный контент