É um requisito para um servidor usar memória RAM ECC em uma GPU enquanto a memória RAM normal da CPU é ECC? Estou pensando que em vez de usar uma Quadro k6000 ou AMD Firepro, poderíamos usar uma GTX 980 ou AMD r9 290... se possível... Além disso, se não for necessariamente necessário usar memória RAM ECC... então existe um GPU "servidor" (o processador i7 é "como" um servidor E7... E7 geralmente é para um servidor/estação de trabalho, assim como i7 geralmente é para um desktop)... Por favor, ajude!!!
Responder1
O maior problema com o uso de placas de desktop em um servidor não é a memória (o que não importa), seu espaço e potência.
As placas de servidor geralmente são menores, sem os enormes dissipadores de calor e ventiladores de 2 a 3 slots que as placas de desktop podem ter.
Eles também geralmente não requerem um cabo de alimentação extra. A maioria dos servidores não possui um conector de alimentação para placa de vídeo de 6 ou 8 pinos (alguns podem, ou você pode conseguir hackear um).
O calor também é um problema - em pequenos sistemas montados em rack há uma quantidade limitada de calor que pode ser removida com ventoinhas de 1 polegada.
E por último drivers - algumas placas de desktop não possuem drivers adequados para sistemas operacionais de servidor. Às vezes você pode usar os drivers de sistema operacional cliente equivalentes, às vezes não.
A outra diferença é o desempenho dos cartões em diversas tarefas. As placas de desktop são projetadas para jogos. Placas de servidor e estação de trabalho geralmente se destacam no desempenho 2D para itens como aceleração de GPU em servidores de terminal e renderização em autocad. Eles também tendem a ser mais estáveis e custam muito mais.
Se uma placa de desktop cabe no seu servidor, tem as conexões de energia apropriadas, não superaquece e oferece o tipo de desempenho que você precisa, vá em frente.
Responder2
GPU ECC RAM não é um requisito estrito para nenhum servidor; não está de forma alguma correlacionado ao uso da RAM do sistema ECC.
Ainda assim, em algumas circunstâncias, GPU com memórias ECC são fortemente preferidas. Basicamente, você precisa de ECC VRAM se usar a GPU para tarefas de computação de GPU de alta precisão (pense em Folding@Home de precisão dupla ou similar). Não é uma coincidência que as VRAM ECC sejam encontradas principalmente em placas de vídeo de nível de computação (por exemplo: tesla K10, Titan), enquanto seu irmão equivalente voltado para jogos usa RAM normal, não ECC.
Quando usado para renderização CAD/CAM e/ou pós-processamento, o ECC RAM é uma adição bem-vinda, mas não uma necessidade absoluta. Para jogos, o ECC VRAM é quase inútil.
O que realmente diferencia a Quadros das placas de vídeo de consumo não é a memória ECC, mas o driver que você pode instalar na primeira. A modelagem CAD/CAM/3D exige a manipulação de modelos complexos de wireframe, onde o mecanismo de geometria e os recursos de antialiasing de linha são levados ao limite (em contraste com os jogos, que exigem texturização, taxa de preenchimento e antialiasing em tela cheia). A placa certa (por exemplo: Quadro de gama baixa ou média) com o driver certo pode proporcionar um desempenho 2X ou 3X melhor do que uma placa de consumo de gama mais alta.Aqui você pode encontrar alguns exemplos.
Responder3
RAM é irrelevante. O maior problema é que as GPUs de consumo hoje em dia são construídas intencionalmente para que o cabo de alimentação não caiba ali (eles o moveram da parte traseira para a lateral).
Você não pode usar GPUs de consumo em datacenters
Às vezes, eles deixam intencionalmente bugs conhecidos no driver GTX/RTX enquanto os corrigem nas placas da estação de trabalho/servidor. O que custa 5 vezes mais dinheiro, é claro.
A NV também colocou várias restrições legais nos EULAs que proíbem explicitamente o uso de tais cartões em data centers. Então, sim, você pode usar GPUs de consumo no data center, mas enfrentará muitos problemas.
Responder4
21/02/2023: ferramenta MemTest86 da Passmarkdocumentaçãotem boas informações sobre ECC.
A memória ECC foi projetada para protegê-lo contra mudanças aleatórias de bits, como raios cósmicos.
O Google fez umestudare concluiu:
Cerca de um terço das máquinas e mais de 8% dos DIMMs da nossa frota tiveram pelo menos um erro corrigível por ano... o número de erros corrigíveis por DIMM é altamente variável, com alguns DIMMs apresentando um grande número de erros, em comparação com outros.
Concedido, este estudo foi para RAM do sistema e não VRAM, mas a corrupção pode acontecer, mas IMO, eu diria que é uma probabilidade baixa e é para isso que servem os backups, espero :-).
Acho que há outros fatores mais importantes a serem considerados dentro da mesma série de GPU (série 3000, por exemplo) ao comprar uma GPU: quantidade de VRAM, tamanho físico, resfriamento/ruído, potência e suporte a nvLink.
Por exemplo, tenho um RTX A2000 com 12 GB ECC VRAM e um Asus ROG Strix RTX 3060 com 12 GB NON-ECC VRAM. O 3060 pode usar drivers Gaming e Studio nVIDIA, é mais rápido, funciona mais frio, tem a mesma quantidade de VRAM e é mais silencioso. Sim, é grande, ocupa 3 slots, consome mais energia e não posso usar o nvLink, mas tenho espaço no meu caso, só preciso de 1 GPU, não há nada de especial na potência e vou lançar os dados em trocas de bits.
No final das contas, são apenas compensações, como a maioria das coisas na computação.
Meu principal problema com as GPUs da estação de trabalho é o ruído daqueles ventiladores chorões, então estou disposto a abrir mão de algumas coisas para obter menos ruído, desde que tenha VRAM suficiente.