Estou tendo problemas com um servidor Ubuntu 20.04 que perde a conexão após três dias. O servidor inicializa usando Dracut. O que ele faz, após inicializar e obter um endereço IP do servidor DHCP, é parar o NetworkManager. Fiz isso porque algumas pessoas apontaram que o NetworkManager poderia estar causando isso.
Gostaria que o servidor permanecesse com o endereço IP obtido após a inicialização.
root@host:/var/log# systemctl list-units --all '*etwork*'
UNIT LOAD ACTIVE SUB DESCRIPTION
networkd-dispatcher.service loaded active running Dispatcher daemon for systemd-networkd
NetworkManager-wait-online.service loaded inactive dead Network Manager Wait Online
NetworkManager.service loaded inactive dead Network Manager
systemd-networkd.service loaded inactive dead Network Service
network-online.target loaded active active Network is Online
network-pre.target loaded inactive dead Network (Pre)
network.target loaded active active Network
LOAD = Reflects whether the unit definition was properly loaded.
ACTIVE = The high-level unit activation state, i.e. generalization of SUB.
SUB = The low-level unit activation state, values depend on unit type.
7 loaded units listed.
To show all installed unit files use 'systemctl list-unit-files'.
Nos logs pode-se ver que a máquina de repente não consegue entrar em contato com o influxdb em uma máquina diferente e depois disso também não consigo fazer ssh. Registros do Journalctl:
Aug 14 11:19:01 myhost pulseaudio[67379]: GetManagedObjects() failed: org.freedesktop.DBus.Error.NoReply: Did not receive a reply. Possible causes include: the remote application did not send a reply, the message bus security policy blocked the reply, the reply timeout expired, or the network connection was broken.
...
Aug 14 11:58:05 myhost telegraf[3018]: 2020-08-14T09:58:05Z E! [outputs.influxdb] When writing to [http://someip]: Post http://someip/write?consistency=any&db=telegraf: net/http: request canceled (Client.Timeout exceeded while awai>
Aug 14 11:58:05 myhost telegraf[3018]: 2020-08-14T09:58:05Z E! [agent] Error writing to outputs.influxdb: could not write any address
A única outra coisa relacionada que posso ver nos logs é esta:
Aug 14 10:34:08 myhost systemd-timesyncd[2889]: Timed out waiting for reply from 91.189.91.157:123 (ntp.ubuntu.com).
Mas isso é algo recorrente e não tenho certeza se está relacionado a esse problema ou apenas a algum componente da rede bloqueando a conexão com aquele endereço IP.