Resposta de erro do daemon: {“message”:“No such container: kubelet”}

Question

Tente seguir os seguintes passos:

Limpe o nó executando

docker system prune
docker volume prune

Isso excluirá todos os volumes do Docker. Tenha cuidado se você tiver
dados importantes em seus volumes.

Limpe os dados de tempo de execução do Rancher/Kubernetes no nó.

rm -rf /etc/cni/ /etc/kubernetes/ /opt/cni/ /var/lib/calico/ /var/lib/cni/ /var/lib/rancher/ /var/run/calico/

Os documentos oficiais sobre limpeza de nós também recomendam a remoção de /opt/rke e
/var/lib/etcd. Você não pode removê-los porque eles contêm
instantâneos e dados do cluster etcd. Isto é especialmente importante caso haja apenas um nó
no cluster.

Execute exec-ed no contêiner rancher e hackeie o status do cluster (obrigado
@ibrokethecloud para a dica):

docker exec -it rancher bash

Dentro do contêiner:

apt-get update && apt-get -y install vim
kubectl edit cluster c-XXXX  # replace the cluster-id with an actual cluster ID

O editor encontrou a chave apiEndpoint (deve estar diretamente abaixo
da status chave) e a removeu. Saia do editor e do contêiner. Certifique-se
de que kubectl diga que atualizou o cluster.

Na UI do Rancher obteve-se o comando para registrar um novo nó.
Defina um nome diferente para o nó do que era antes, adicionando um
--node-name ao comando docker run (na verdade, há uma caixa de edição para isso
nas configurações avançadas). Parecia assim:

docker run -d --privileged --restart=unless-stopped --net=host \
  -v /etc/kubernetes:/etc/kubernetes -v /var/run:/var/run rancher/rancher-agent:v2.2.6 \
  --server https://rancher.example.com --token XXXXXXXXXXXXXXX --node-name mynode2 \
  --etcd --controlplane --worker

Execute o comando acima no nó limpo e, finalmente, ele foi registrado
com sucesso e o RKE iniciou todos os contêineres kube-* e .kubelet

Dê uma olhada:fazendeiro-kubelet, rancher-2-primeiros passos.

Answer 1