He configurado un clúster de Kubernetes con 3 maestros y varios trabajadores (kubeadm).
Si cierro un trabajador, el nodo pasa al estado No listo con bastante rapidez, pero lleva algún tiempo reprogramar los pods asignados a ese nodo.
¿Cómo puedo disminuir el ¿Valores de tiempo de espera para que mi clúster reaccione más rápido?
Respuesta1
Desafortunadamente, no hay manera de hacerlo más rápido. Se supone que Kubernetes debe realizar muchas acciones para reiniciar los pods desde un nodo fallido. Sin embargo, es posible mejorar el tiempo de reacción.
Por ejemplo, reduzca el valor de node-monitor-grace-period, el valor predeterminado es 40 segundos. Puede reducir el tiempo entre la falla real de un nodo y el cambio de su estado.
Puedes encontrar más detalles sobre estas opciones.aquí