nVidia가 왜 이러한 유형의 그래픽 카드 구성(이 경우 > GT730)을 제공하는지 궁금합니다.
그건 알지만 bandwidth = Memory clock x Memory interface width
메모리 구성이나 CUDA 코어는 어떻습니까? 그들은 어디로 놀러 오나요?
- 왜 64비트 버전에 1GB가 아닌 2GB가 있는지 궁금합니다. (128비트 버전은 1GB입니다.)
- 왜 GDDR5 버전에는 2GB가 아닌 1GB가 있는지 궁금합니다. (DDR3 버전은 2GB입니다.)
- 왜 GDDR5 버전이 128비트가 아닌 64비트인지 궁금합니다. (DDR3 버전에는 128이 있습니다).
또한 64비트 4GB가 128비트 2GB 카드와 동일한 성능을 발휘하는지 궁금합니다. 아니면 64비트 2GB 버전이 128비트 1GB 카드와 동일한 성능을 발휘합니까?
답변1
왜 64비트 버전에 1GB가 아닌 2GB가 있는지 궁금합니다. >128비트 버전에는 1GB가 있습니다.
이는 GPU에 두 개의 메모리 컨트롤러가 있기 때문에 거의 확실합니다.
각각 1GB의 메모리를 사용할 수 있는 64비트 채널 2개 또는 단일 1GB 메모리 영역을 사용할 수 있는 128비트 채널 1개가 제공됩니다.
왜 GDDR5 버전에는 2GB가 아닌 1GB가 있는지 궁금합니다. >DDR3 버전에는 2GB가 있습니다.
아마도 GDDR5가 제공하는 추가 대역폭에는 GPU의 내부 멀티플렉싱이 필요하여 이를 하나의 메모리 채널로 제한하기 때문일 것입니다. 실제 이유는 GPU 설계자와 Nvidia 자신만이 알 수 있습니다.
또한 64비트 4GB가 128비트 2GB 카드와 동일한 성능을 발휘하는지 궁금합니다. 아니면 64비트 2GB가 128비트 1GB 카드와 동일한 성능을 발휘합니까?
아니요. 메모리의 "비트"는 사용 가능한 효과적인 메모리 대역폭에 영향을 미칩니다. 메모리 인터페이스 너비 바로 아래의 그림을 보십시오.
그래픽 작업은 엄청나게 메모리에 묶여 있는 경향이 있으며, 일반적으로 메모리 대역폭이 높을수록 성능이 더 좋아집니다. 그럼에도 불구하고 더 많은 메모리를 갖춘 낮은 대역폭 카드가 메모리는 적지만 대역폭이 높은 카드보다 더 나은 성능을 발휘할 수 있는 작업이 있을 수 있습니다.
당신은 여러 (솔직히 말해서) 매우 열악한 카드들 사이에서 잡초를 비교하고 있으며, 그들 사이에 엄청난 성능 차이가 나타날지 심각하게 의심됩니다.
이유는 제품 차별화와 가능하기 때문입니다.
답변2
CUDA 코어는 GPU에 있는 멀티프로세서 수, ALU 레인 수, ALU 레인 너비를 기반으로 계산됩니다.
내 GeForce GT 730(DDR3, 64비트 버전)의 경우:
(2 multiprocessors * 192 64-bit ALU lanes) = 384 CUDA cores
메모리 대역폭은 GPU의 멀티프로세서 수를 기준으로 계산됩니다.
(2 multiprocessors * 800 MHz) = 1600 MHz effective
이 장치에서는 단정밀도 부동 소수점 연산이 배정밀도보다 24배 빠릅니다. 이는 버스 폭과 멀티프로세서 수에 따라 달라질 수 있지만 현재로서는 비교할 수 있는 다른 항목이 없습니다.