
Tengo cuatro servidores Supermicro de segunda mano (X9DRi-LN4F+ en cajas CSE-815TS). Cada uno tenía cinco FAN-0086L4 (https://store.supermicro.com/index.php/40mm-fan-0086l4.html) que empezó a fallar. Por fallar, me refiero a que el registro de eventos en la interfaz web de IPMI contenía entradas como:
369 ... FANA Fan Lower Critical - Going Low - Asserted
370 ... FANA Fan Lower Non-Recoverable - Going Low - Asserted
Cuando abrí la caja, el ventilador estaba "atascado". Intenté cambiar la ubicación del ventilador pero fue en vano. Luego empezaron a fallar más ventiladores: ocho de los veinte en las cuatro máquinas. Pensé que podría tener un lote defectuoso así que reemplacé los veinte ventiladores por este:https://www.aliexpress.com/item/NIDEC-4056-R40W12BS5AC-65-12V-0-80A-4cm-For-SUPERMICRO-FAN-0086L4-Cooling-Fan/32806512302.html?spm=2114.11010108.01008.1. 650c649bwYCBmG.
Ahora los nuevos lotes empiezan a fallar: tres de veinte en los cuatro meses desde que compré los repuestos. ¿Qué necesito investigar a continuación? Los servidores están ubicados en un garaje con muy poca cantidad de polvo: los ventiladores y el interior de las cajas estaban visiblemente limpios cuando los abrí. La temperatura está en el rango de 2-18°C y la humedad en el rango de 40-70%.