
У меня есть кластер HA K8S с 4 главными узлами (в 2 центрах обработки данных, по 2 на каждой площадке), но команда kubectl перестает работать после выключения 2 главных узлов. Ожидаемое ли это поведение?
Я хочу, чтобы кластер пережил сбой в работе центра обработки данных.
PS: Я использую 2 HA proxy + Keepalived
решение1
Я предполагаю, что ваш мастер будет размещать контейнеры etcd, не так ли? Тогда это ожидаемо, да.
ПроверятьFAQ по etcd. Кластер из 4 узлов действительно будет иметь отказоустойчивость 1 участника. Вам понадобится 5 участников, чтобы обеспечить 2 сбоя. Хотя рекомендуемый размер для Kubernetes обычно составляет 3.
Развертывание нескольких датацентров может быть сложным: задержка между участниками etcd может стать проблемой. Если вас это устраивает, то для того, чтобы пережить крах DC, вам нужно 3 DC. В противном случае вам лучше рассмотреть возможность создания отдельных кластеров и внедрения отказоустойчивости/репликации поверх них.