¿Es necesaria una GPU habilitada con RAM ECC para un servidor, o una GPU normal funcionará bien en un servidor?

¿Es necesaria una GPU habilitada con RAM ECC para un servidor, o una GPU normal funcionará bien en un servidor?

¿Es un requisito que un servidor use RAM ECC en una GPU mientras que la RAM de CPU normal es ECC? Estoy pensando que en lugar de usar una Quadro k6000 o AMD Firepro, podríamos usar una GTX 980 o AMD r9 290... si es posible... Además, si no es necesariamente necesario usar RAM ECC... entonces hay una GPU "servidor" (el procesador i7 es "como" un servidor E7... E7 es generalmente para un servidor/estación de trabajo, ya que i7 es generalmente para una computadora de escritorio)... ¡¡¡Por favor ayuda!!!

Respuesta1

El mayor problema con el uso de tarjetas de escritorio en un servidor no es la memoria (que no importa), su espacio y potencia.

Las tarjetas de servidor suelen ser más pequeñas, sin los enormes disipadores de calor de 2 o 3 ranuras y ventiladores que pueden tener las tarjetas de escritorio.

Por lo general, tampoco requieren un cable de alimentación adicional. La mayoría de los servidores no tienen un conector de alimentación para tarjeta de video de 6 u 8 pines (algunos pueden, o usted puede hackear uno).

El calor también es un problema: en los sistemas pequeños de montaje en rack hay una cantidad limitada de calor que se puede eliminar con ventiladores de 1 pulgada.

Y, por último, controladores: algunas tarjetas de escritorio no tienen controladores adecuados para los sistemas operativos del servidor. A veces puede utilizar los controladores equivalentes del sistema operativo del cliente, a veces no.

La otra diferencia es el rendimiento de las tarjetas en diversas tareas. Las tarjetas de escritorio están diseñadas para juegos. Las tarjetas de servidor y estación de trabajo generalmente destacan en rendimiento 2D para cosas como la aceleración de GPU en servidores terminales y cosas como la renderización de AutoCAD. También tienden a ser más estables y cuestan mucho más.

Si una tarjeta de escritorio se adapta a su servidor, tiene las conexiones de alimentación adecuadas, no se sobrecalienta y ofrece el tipo de rendimiento que necesita, hágalo.

Respuesta2

GPU ECC RAM no es un requisito estricto para ningún servidor; no está correlacionado de ningún modo con el uso de la RAM del sistema ECC.

Aún así, en algunas circunstancias, se prefieren las GPU con memorias ECC. Básicamente, necesita ECC VRAM si usa la GPU para tareas de cálculo de GPU de alta precisión (piense en Folding@Home de doble precisión o similar). No es una coincidencia que la VRAM ECC se encuentre principalmente en tarjetas de video de calidad informática (por ejemplo: tesla K10, Titan), mientras que su hermano equivalente orientado a juegos use RAM normal sin ECC.

Cuando se utiliza para CAD/CAM y/o renderizado de posprocesamiento, la RAM ECC es una adición bienvenida, pero no una necesidad absoluta. Para juegos, ECC VRAM es casi inútil.

Lo que realmente distingue a Quadros de las tarjetas de video de consumo no es la memoria ECC, sino el controlador que puede instalar en la primera. El modelado CAD/CAM/3D requiere la manipulación de un modelo de estructura alámbrica complejo, donde el motor de geometría y las capacidades de antialiasing de líneas se llevan al límite (a diferencia de los juegos, que enfatizan las texturas, la tasa de relleno y el antialiasing de pantalla completa). La tarjeta adecuada (por ejemplo, Quadro de gama baja o media) con el controlador adecuado puede ofrecer un rendimiento 2 o 3 veces mejor que una tarjeta de consumo de gama alta.Aquí puedes encontrar algunos ejemplos.

Respuesta3

La RAM es irrelevante. El mayor problema es que hoy en día las GPU de consumo se construyen intencionalmente para que el cable de alimentación no quepa allí (lo movieron de atrás hacia un lado).

No se pueden utilizar GPU de consumo en centros de datos

A veces dejan intencionalmente errores conocidos en el controlador GTX/RTX mientras lo reparan en las tarjetas de la estación de trabajo/servidor. Lo que cuesta 5 veces más dinero, por supuesto.

NV también impuso varias restricciones legales en los EULA que prohíben explícitamente el uso de dichas tarjetas en los centros de datos. Entonces, sí, puedes usar GPU de consumo en el centro de datos, pero enfrentarás muchos problemas.

Respuesta4

2023-02-21: herramienta MemTest86 de Passmarkdocumentacióntiene buena información sobre ECC.


La memoria ECC está destinada a protegerlo de cambios aleatorios de bits provenientes de rayos cósmicos similares.

Google hizo unestudiary concluyó:

Aproximadamente un tercio de las máquinas y más del 8 % de los DIMM de nuestra flota experimentaron al menos un error corregible por año... la cantidad de errores corregibles por DIMM es muy variable, y algunos DIMM experimentan una gran cantidad de errores, en comparación con otros.

Es cierto que este estudio fue para la RAM del sistema y no para la VRAM, pero puede ocurrir corrupción, pero en mi opinión, diría que es una probabilidad baja y, con suerte, para eso están las copias de seguridad :-).

Creo que hay otros factores más importantes a considerar dentro de la misma serie de GPU (serie 3000, por ejemplo) al comprar una GPU: cantidad de VRAM, tamaño físico, refrigeración/ruido, potencia y compatibilidad con nvLink.

Por ejemplo, tengo una RTX A2000 con 12 GB de VRAM ECC y una Asus ROG Strix RTX 3060 con 12 GB de VRAM NO ECC. El 3060 puede usar los controladores nVIDIA Gaming y Studio, es más rápido, funciona a menor temperatura, tiene la misma cantidad de VRAM y es más silencioso. Sí, ocupa 3 ranuras, usa más energía y no puedo usar nvLink, pero tengo espacio en mi caso, solo necesito 1 GPU, la energía no es gran cosa y tiraré los dados en bits.

Al final del día, son solo compensaciones, como la mayoría de las cosas en informática.

Mi principal problema con las GPU de las estaciones de trabajo es el ruido de esos ventiladores quejosos, por lo que estoy dispuesto a renunciar a algunas cosas por un menor ruido siempre que tenga suficiente VRAM.

información relacionada