서버에 ECC RAM 지원 GPU가 필요합니까, 아니면 일반 GPU가 서버에서 제대로 작동합니까?

서버에 ECC RAM 지원 GPU가 필요합니까, 아니면 일반 GPU가 서버에서 제대로 작동합니까?

일반 CPU 램이 ECC인 동안 서버가 GPU에서 ECC 램을 사용해야 한다는 요구 사항이 있습니까? 저는 Quadro k6000이나 AMD Firepro를 사용하는 대신 가능하다면 GTX 980이나 AMD r9 290을 사용할 수 있다고 생각합니다... 그리고 반드시 ECC 램을 사용할 필요가 없다면... 거기에는 "서버" GPU(i7 프로세서는 서버 E7과 "유사"합니다. i7은 일반적으로 데스크탑용이므로 E7은 일반적으로 서버/워크스테이션용입니다.)... 도와주세요!!!

답변1

서버에서 데스크탑 카드를 사용할 때 가장 큰 문제는 메모리(중요하지 않음), 공간 및 전력에 관한 것이 아닙니다.

서버 카드는 일반적으로 데스크탑 카드가 가질 수 있는 대규모 2-3 슬롯 방열판 및 팬이 없기 때문에 더 작습니다.

또한 일반적으로 추가 전원 케이블이 필요하지 않습니다. 대부분의 서버에는 6핀 또는 8핀 비디오 카드 전원 커넥터가 없습니다. 일부 서버에는 해킹할 수도 있습니다.

열도 문제입니다. 소형 랙마운트 시스템에서는 1인치 팬으로 제거할 수 있는 열의 양이 너무 많습니다.

마지막으로 드라이버 - 일부 데스크탑 카드에는 서버 운영 체제에 적합한 드라이버가 없습니다. 때로는 동등한 클라이언트 OS 드라이버를 사용할 수 있지만 때로는 그렇지 않을 수도 있습니다.

또 다른 차이점은 카드가 다양한 작업에서 수행되는 방식입니다. 데스크탑 카드는 게임용으로 설계되었습니다. 서버 및 워크스테이션 카드는 일반적으로 터미널 서버의 GPU 가속 및 Autocad 렌더링과 같은 작업에 대한 2D 성능이 뛰어납니다. 또한 더 안정적인 경향이 있고 비용도 훨씬 더 많이 듭니다.

데스크탑 카드가 서버에 적합하고, 과열되지 않고 적절한 전원 연결을 갖추고, 필요한 유형의 성능을 제공한다면 이를 선택하십시오.

답변2

GPU ECC RAM은 모든 서버에 대한 엄격한 요구 사항이 아닙니다. ECC 시스템 RAM 사용과 관련된 모드가 없습니다.

그러나 어떤 상황에서는 ECC 메모리를 탑재한 GPU가 강력하게 선호됩니다. 기본적으로 고정밀 GPU 컴퓨팅 작업에 GPU를 사용하는 경우 ECC VRAM이 필요합니다(이중 정밀도 Folding@Home 또는 이와 유사한 것을 생각해 보세요). ECC VRAM이 컴퓨팅 등급 비디오 카드(예: Tesla K10, Titan)에서 주로 발견되는 반면, 동등한 게임 지향 형제가 일반 비 ECC RAM을 사용하는 것은 우연이 아닙니다.

CAD/CAM 및/또는 후처리 렌더링에 사용할 경우 ECC RAM은 환영할 만한 추가 기능이지만 반드시 필요한 것은 아닙니다. 게임의 경우 ECC VRAM은 거의 쓸모가 없습니다.

Quadros가 소비자용 비디오 카드와 실제로 다른 점은 ECC 메모리가 아니라 ECC 메모리에 설치할 수 있는 드라이버입니다. CAD/CAM/3D 모델링에는 지오메트리 엔진과 라인 앤티앨리어싱 기능이 한계까지 밀린 복잡한 와이어프레임 모델의 조작이 필요합니다(텍스처링, 필레이트 및 전체 화면 앤티앨리어싱을 강조하는 게임과 달리). 올바른 드라이버가 포함된 올바른 카드(예: 저가형 또는 중급형 Quadro)는 고급형 소비자 카드보다 2배 또는 3배 더 나은 성능을 제공할 수 있습니다.여기에서 몇 가지 예를 찾을 수 있습니다.

답변3

램은 상관없습니다. 가장 큰 문제는 요즘 소비자 GPU가 의도적으로 전원 케이블이 거기에 맞지 않도록 제작된다는 것입니다(뒤에서 옆으로 옮겼습니다).

데이터 센터에서는 소비자 GPU를 사용할 수 없습니다

때로는 워크스테이션/서버 카드에서 이를 수정하는 동안 의도적으로 GTX/RTX 드라이버에 알려진 버그를 남겨두기도 합니다. 물론 돈도 5배는 들지만.

NV는 또한 데이터 센터에서 이러한 카드의 사용을 명시적으로 금지하는 EULA에 다양한 법적 제한 사항을 적용했습니다. 그렇습니다. 데이터 센터에서 소비자 GPU를 사용할 수는 있지만 많은 문제에 직면하게 될 것입니다.

답변4

2023-02-21: Passmark의 MemTest86 도구선적 서류 비치ECC에 대한 좋은 정보가 있습니다.


ECC 메모리는 우주선과 같은 무작위 비트 플립으로부터 사용자를 보호하기 위한 것입니다.

구글이 한 일공부하다그리고 결론을 내렸다:

우리 회사의 약 3분의 1의 시스템과 8% 이상의 DIMM에서 연간 최소 한 번의 수정 가능한 오류가 발생했습니다. DIMM당 수정 가능한 오류 수는 매우 가변적이며 일부 DIMM은 다른 DIMM에 비해 엄청난 수의 오류를 경험합니다.

이 연구는 VRAM이 아닌 시스템 RAM에 대한 것이지만 손상이 발생할 수 있지만 IMO에서는 가능성이 낮으며 이것이 백업의 목적이라고 말하고 싶습니다. :-).

GPU를 구입할 때 동일한 GPU 시리즈(예: 3000 시리즈) 내에서 고려해야 할 다른 더 중요한 요소(VRAM 용량, 물리적 크기, 냉각/소음, 전력 및 nvLink 지원)가 있다고 생각합니다.

예를 들어 12GB ECC VRAM이 포함된 RTX A2000과 12GB NON-ECC VRAM이 포함된 Asus ROG Strix RTX 3060이 있습니다. 3060은 게이밍 및 Studio nVIDIA 드라이버를 모두 사용할 수 있으며 더 빠르고 더 시원하게 실행되며 동일한 양의 VRAM을 가지며 더 조용합니다. 예, 3개의 슬롯을 차지하며 더 많은 전력을 사용하고 nvLink를 사용할 수 없지만 제 경우에는 공간이 있고 GPU 1개만 필요하며 전력은 별로 필요하지 않으며 비트 플립에서 주사위를 굴립니다.

컴퓨팅의 대부분의 경우와 마찬가지로 하루가 끝나면 절충안이 적용됩니다.

워크스테이션 GPU의 주요 문제점은 윙윙거리는 송풍기 팬의 소음이므로 VRAM이 충분하다면 소음을 줄이기 위해 몇 가지를 포기할 의향이 있습니다.

관련 정보