нет соединения и ошибка cgroup на автономном kubelet с containerd на ubuntu

Question

Спустя некоторое время мне удалось вернуться к этому вопросу и немного разобраться с неполадками.

Итак, изначальной мыслью было, что у контейнера нет сети. Чтобы устранить эту неполадку, можно сделать следующее:

# ip netns
cni-f6078594-55bf-95d3-a2fd-33a5095b74c9 (id: 0)

Таким образом, для каждого Pod, который запускает Kubelet, он создаст сетевое пространство имен и прикрепит виртуальные интерфейсы, это дизайн Pod.Проверьте это здесь.

Продолжаем устранение неполадок:

# ip netns exec cni-f6078594-55bf-95d3-a2fd-33a5095b74c9 ip addr
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
       valid_lft forever preferred_lft forever
    inet6 ::1/128 scope host 
       valid_lft forever preferred_lft forever
2: eth0@if11: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc noqueue state UP group default 
    link/ether 56:ef:8e:da:f2:29 brd ff:ff:ff:ff:ff:ff link-netnsid 0
    inet 10.200.0.15/24 brd 10.200.0.255 scope global eth0
       valid_lft forever preferred_lft forever
    inet6 fe80::54ef:8eff:feda:f229/64 scope link 
       valid_lft forever preferred_lft forever

Это подчеркивает, что интерфейсу внутри сетевого пространства имен действительно был назначен IP-адрес.10.200.0.15/24

Попробуем подключиться через пространство имен:

# ip netns exec cni-f6078594-55bf-95d3-a2fd-33a5095b74c9 ping 8.8.8.8
PING 8.8.8.8 (8.8.8.8) 56(84) bytes of data.
64 bytes from 8.8.8.8: icmp_seq=1 ttl=57 time=0.975 ms
64 bytes from 8.8.8.8: icmp_seq=2 ttl=57 time=1.24 ms

Что подтверждает, что контейнер имеет возможность подключения, при попытке:

# ip netns exec cni-f6078594-55bf-95d3-a2fd-33a5095b74c9 ping google.com
ping: google.com: Temporary failure in name resolution

Это позволяет сделать вывод, что у нас проблема с DNS, а не с подключением.

Итак, чтобы решить эту проблему, я создал новый файл /root/resolve.conf с хорошими серверами:

nameserver 8.8.8.8
nameserver 8.8.4.4

И обновил команду:

--resolv-conf=/etc/resolv.conf \

Чтобы указать на новый файл, выполните следующие действия:

--resolv-conf=/root/resolv.conf \

А также удалил кластер DNS:

--cluster-dns=127.0.0.53 \

Все еще необходимо исправить кластерные DNS, хотя для целей проверки достаточно указать DNS на DNS за пределами экземпляра.

РЕДАКТИРОВАТЬ:

Оглядываясь назад, я могу сказать, что улучшил это. Я оставил resolv.conf без изменений и обновил cluster-dns:

--cluster-dns=8.8.8.8 \

Это было лучшее решение на данный момент. Все еще расследуем.

Answer 1