Hardware actualmente en uso

Hardware actualmente en uso

Tengo un servidor que parece estar maldito. Cada 2-5 días falla (Todavía soy bastante nuevo en esto)

He pasado las últimas dos semanas tratando de encontrar soluciones. Pero claramente no voy a llegar a ninguna parte. Cualquier referencia a un PSOD que encontré está relacionada con versiones mucho más antiguas, causadas directamente por una máquina virtual que se ejecuta en la caja, controladores de HP iLO o alguna otra situación que no parece aplicarse a mi problema.

No pude obtener nada útil del muro de texto, aparte de algo sobre el agente de vCenter Server y posiblemente algo sobre mi NIC 10g. (que ya he eliminado, por si acaso)

Aquíson un par de fotos.

Debería tener más, pero aparentemente no los guardé.

Hardware actualmente en uso


Hardware que he probado hasta ahora

  • 3 placas base
    • Supermicro X9DRI-FO
    • intel extremo dz77ga-70k
    • Placa de escritorio Intel DX58SO
  • 2 juegos de CPU (un juego de zócalo doble y un zócalo único)
    • Xeon E5-2670
    • Xeon X5650 (Puede que esta no sea la CPU correcta, pero actualmente está enterrada
  • 3 fuentes de alimentación
    • 550w
    • 700w
    • 850w
  • 2 juegos de RAM probadas (un juego ECC)
    • 32GB DDR3 ECC
    • 16 GB DDR3
  • 2 dispositivos de instalación (uno giratorio, un USB)

Otras cosas que he probado

  • Reinstalar
  • Volver a descargar los medios de instalación y reinstalar desde una unidad USB diferente (y la misma)
  • No tener VM en ejecución

Me abaraté un pocochasis, por lo que no tengo mucha confianza en los backplanes. También intenté intercambiar las bahías. y simplemente conéctelo directamente a una conexión SATA en la placa base

Y el servidor está detrás de unUPS, por lo que la rareza del poder no debería ser un problema.

Estoy 99% seguro de que hay algo obvio que me estoy perdiendo, pero después de estrellarte la cara contra la pared por un tiempo, comienza a ser difícil de ver. Afortunadamente, necesitaba comenzar a publicar preguntas para obtener reputación de todos modos.

Respuesta1

Por supuesto, deberías utilizar hardware compatible si es posible. También hay conjuntos de controladores para diferentes proveedores como HPE o Dell. Entonces simplemente podría ser un problema del controlador.

Otra cosa que no entiendo es ¿por qué estás usando la compilación 4564106 si ya reinstalaste ESXi?

La compilación actual es 7388607. No conozco todo el historial de parches, pero creo que no podría estar mal usar la versión más nueva con las correcciones de errores más recientes...

información relacionada