
Tenho quatro servidores Supermicro usados (X9DRi-LN4F+ em casos CSE-815TS). Cada um tinha cinco FAN-0086L4s (https://store.supermicro.com/index.php/40mm-fan-0086l4.html) que começou a falhar. Por falha, quero dizer que o log de eventos na interface da web IPMI continha entradas como:
369 ... FANA Fan Lower Critical - Going Low - Asserted
370 ... FANA Fan Lower Non-Recoverable - Going Low - Asserted
Quando abri o gabinete o ventilador estava "preso". Tentei trocar a localização do ventilador, mas sem sucesso. Então, mais ventiladores começaram a falhar – oito entre vinte ventiladores nas quatro máquinas. Achei que poderia ter um lote com defeito, então substituí todos os vinte ventiladores por este:https://www.aliexpress.com/item/NIDEC-4056-R40W12BS5AC-65-12V-0-80A-4cm-For-SUPERMICRO-FAN-0086L4-Cooling-Fan/32806512302.html?spm=2114.11010108.01008.1. 650c649bwYCBmG.
Agora o novo lote está começando a falhar: três em vinte nos quatro meses desde que comprei os substitutos. O que preciso investigar a seguir? Os servidores estão localizados em uma garagem com pouquíssima poeira: as ventoinhas e o interior dos gabinetes estavam visivelmente limpos quando os abri. A temperatura está na faixa de 2-18°C e a umidade na faixa de 40-70%.