O link Ethernet cai e volta na reinicialização do servidor

O link Ethernet cai e volta na reinicialização do servidor

Temos um servidor DELL R610 conectado a um switch DELL PowerConnect 5424. Este switch está conectado a uma SAN DELL Equallogic. O DELL R610 serve como um servidor de banco de dados MySQL, a SAN fornece o diretório de dados, montado como uma unidade iSCSI.

De acordo com uma pergunta anterior feita por mimaqui, estamos observando que após a reinicialização, o MySQL não funciona sozinho. Além disso, este é um comportamento intermitente. Ao investigar, descobrimos que o serviço iniciador iSCSI falha ao executar comandos na inicialização. Ao examinar os logs, descobrimos que há um pequeno problema quando nossas interfaces de rede são ativadas. Grepped os logs do bnx2:

 bnx2: Broadcom NetXtreme II Gigabit Ethernet Driver bnx2 v2.2.4 (Aug 05, 2013)
 bnx2 0000:01:00.0 eth0: Broadcom NetXtreme II BCM5709 1000Base-T (C0) PCI Express found at mem d6000000, IRQ 36, node addr 5c:f9:dd:f1:8a:ea
 bnx2 0000:01:00.1 eth1: Broadcom NetXtreme II BCM5709 1000Base-T (C0) PCI Express found at mem d8000000, IRQ 48, node addr 5c:f9:dd:f1:8a:ec
 bnx2 0000:02:00.0 eth2: Broadcom NetXtreme II BCM5709 1000Base-T (C0) PCI Express found at mem da000000, IRQ 32, node addr 5c:f9:dd:f1:8a:ee
 bnx2 0000:02:00.1 eth3: Broadcom NetXtreme II BCM5709 1000Base-T (C0) PCI Express found at mem dc000000, IRQ 42, node addr 5c:f9:dd:f1:8a:f0
 bnx2 0000:02:00.0: irq 78 for MSI/MSI-X
 bnx2 0000:02:00.0: irq 79 for MSI/MSI-X
 bnx2 0000:02:00.0: irq 80 for MSI/MSI-X
 bnx2 0000:02:00.0: irq 81 for MSI/MSI-X
 bnx2 0000:02:00.0: irq 82 for MSI/MSI-X
 bnx2 0000:02:00.0: irq 83 for MSI/MSI-X
 bnx2 0000:02:00.0: irq 84 for MSI/MSI-X
 bnx2 0000:02:00.0: irq 85 for MSI/MSI-X
 bnx2 0000:02:00.0: irq 86 for MSI/MSI-X
 bnx2 0000:02:00.0 em3: using MSIX
 bnx2 0000:01:00.0: irq 87 for MSI/MSI-X
 bnx2 0000:01:00.0: irq 88 for MSI/MSI-X
 bnx2 0000:01:00.0: irq 89 for MSI/MSI-X
 bnx2 0000:01:00.0: irq 90 for MSI/MSI-X
 bnx2 0000:01:00.0: irq 91 for MSI/MSI-X
 bnx2 0000:01:00.0: irq 92 for MSI/MSI-X
 bnx2 0000:01:00.0: irq 93 for MSI/MSI-X
 bnx2 0000:01:00.0: irq 94 for MSI/MSI-X
 bnx2 0000:01:00.0: irq 95 for MSI/MSI-X
 bnx2 0000:01:00.0 em1: using MSIX
 bnx2 0000:01:00.1: irq 96 for MSI/MSI-X
 bnx2 0000:01:00.1: irq 97 for MSI/MSI-X
 bnx2 0000:01:00.1: irq 98 for MSI/MSI-X
 bnx2 0000:01:00.1: irq 99 for MSI/MSI-X
 bnx2 0000:01:00.1: irq 100 for MSI/MSI-X
 bnx2 0000:01:00.1: irq 101 for MSI/MSI-X
 bnx2 0000:01:00.1: irq 102 for MSI/MSI-X
 bnx2 0000:01:00.1: irq 103 for MSI/MSI-X
 bnx2 0000:01:00.1: irq 104 for MSI/MSI-X
 bnx2 0000:01:00.1 em2: using MSIX
 bnx2 0000:01:00.0 em1: NIC Copper Link is Up, 100 Mbps full duplex
 bnx2 0000:02:00.0 em3: NIC Copper Link is Up, 1000 Mbps full duplex
 bnx2 0000:01:00.1 em2: NIC Copper Link is Up, 1000 Mbps full duplex
 **bnx2 0000:01:00.1 em2: NIC Copper Link is Down**
 bnx2 0000:01:00.1 em2: NIC Copper Link is Up, 1000 Mbps full duplex

Nossa solução atual é reiniciar o servidor. Até o momento, ao reiniciar o servidor, tudo corre bem e o blip mostrado nos logs acima não é observado.

Alguém pode ajudar em como prosseguir e solucionar o que está falhando? eu tenho referidoaquimas provavelmente este não é o meu caso, pois nosso problema ocorre apenas na reinicialização. Fora isso, não há erros de NIC no ifconfig e não há queda/perda de pacotes nas NICs. Nunca tivemos nenhum problema de rede quando o servidor estava ativo.

O DELL R610 está executando o Ubuntu 14.04.

Mais alguns logs sugeridos por @Dom:

 $ cat logfile.mysql.withoutdate |grep -B 15 -A 15 "NIC Copper Link is Down"
 Loading iSCSI transport class v2.0-870.
 bnx2 0000:01:00.1 em2: using MSIX
 IPv6: ADDRCONF(NETDEV_UP): em2: link is not ready
 iscsi: registered transport (tcp)
 iscsi: registered transport (iser)
 multipathd (2470): /proc/2470/oom_adj is deprecated, please use /proc/2470/oom_score_adj instead.
 bnx2 0000:01:00.0 em1: NIC Copper Link is Up, 100 Mbps full duplex

 IPv6: ADDRCONF(NETDEV_CHANGE): em1: link becomes ready
 bnx2 0000:02:00.0 em3: NIC Copper Link is Up, 1000 Mbps full duplex
 , receive & transmit flow control ON
 IPv6: ADDRCONF(NETDEV_CHANGE): em3: link becomes ready
 bnx2 0000:01:00.1 em2: NIC Copper Link is Up, 1000 Mbps full duplex
 , receive & transmit flow control ON
 IPv6: ADDRCONF(NETDEV_CHANGE): em2: link becomes ready
 bnx2 0000:01:00.1 em2: NIC Copper Link is Down
 bnx2 0000:01:00.1 em2: NIC Copper Link is Up, 1000 Mbps full duplex
 , receive & transmit flow control ON

informação relacionada