
Frequentemente enfrentamos um problema em que uma das interfaces de rede (Intel Ethernet Controller i350) fica inativa frequentemente com o log do kernel apresentando algum rastreamento de chamada e um erro dizendo:
[202323.307358] Hardware name: PowerEdge C8220
[202323.307359] NETDEV WATCHDOG: eth0 (igb): transmit queue 3 timed out
[202323.307466] igb 0000:02:00.0: eth0: Reset adapter
Executamos alguns testes básicos online e offline usando ethtool e muitos falharam.
Para depurar ainda mais o problema, pegamos EEPROM and register dump using ethtool
e descobrimos que ele estava completamente com o binário 1, resultando emFFFFFF.....
Alguém já enfrentou esse tipo de problema antes?
Alguém pode me ajudar a depurar ainda mais o problema.
**Editar: **
Atualizei o driver do dispositivo de 3.0.6 para 5.0.6. mas ethtool
está mostrando informações erradas
# ethtool -i eth1
driver: igb
version: 3.0.6-k2
firmware-version: 1.5-7
# modinfo igb
filename: /lib/modules/2.6.32-5-amd64/kernel/drivers/net/igb/igb.ko
version: 5.0.6
Eu não sei como isso está aparecendo assim.
Podemos atualizar o firmware pela sessão SSH?