Eu me pergunto por que a nVidia oferece esse tipo de configuração de suas placas gráficas, neste caso > GT730.
Eu sei disso bandwidth = Memory clock x Memory interface width
, mas e quanto à configuração de memória ou núcleos CUDA? Onde eles vêm brincar?
- Eu me pergunto por que a versão de 64 bits tem 2 GB e não 1 GB? (enquanto a versão de 128 bits possui 1 GB).
- Eu me pergunto por que a versão GDDR5 tem 1GB e não 2GB? (enquanto a versão DDR3 tem 2GB).
- Eu me pergunto por que a versão GDDR5 tem 64 bits e não 128 bits? (enquanto a versão DDR3 tem 128).
Também me pergunto se o cartão de 4 GB de 64 bits tem o mesmo desempenho que o cartão de 2 GB de 128 bits? Ou a versão de 2 GB de 64 bits tem o mesmo desempenho que o cartão de 1 GB de 128 bits?
Responder1
Eu me pergunto por que a versão de 64 bits tem 2 GB e não 1 GB? >Enquanto a versão de 128 bits tem 1GB.
É quase certo que isso ocorre porque a GPU possui dois controladores de memória.
Você obtém dois canais de 64 bits capazes de usar 1 GB de memória cada ou um canal de 128 bits capaz de usar uma única área de memória de 1 GB.
Eu me pergunto por que a versão GDDR5 tem 1GB e não 2GB? >Enquanto a versão DDR3 possui 2GB.
Provavelmente porque a largura de banda extra fornecida pelo GDDR5 requer alguma multiplexação interna na GPU que a limita a um canal de memória. O verdadeiro motivo só seria conhecido pelos designers de GPU e pela própria Nvidia.
Também me pergunto se 64 bits de 4 GB tem o mesmo desempenho que um cartão de 128 bits de 2 GB? ou 64 bits de 2 GB tem o mesmo desempenho do cartão de 128 bits de 1 GB?
Não. O "bitness" da memória afeta a largura de banda efetiva da memória disponível. Observe a figura logo abaixo da largura da interface de memória.
As tarefas gráficas tendem a ser incrivelmente limitadas pela memória; mais largura de banda de memória geralmente significa que terá um desempenho melhor. Mesmo assim, pode haver tarefas em que uma placa com menor largura de banda e mais memória possa ter um desempenho melhor do que uma placa com menos memória, mas com maior largura de banda.
Você está comparando as ervas daninhas entre vários cartões (francamente) muito ruins e duvido seriamente que você verá uma enorme diferença de desempenho entre eles.
Quanto ao porquê: diferenciação de produtos e porque podem.
Responder2
Os núcleos CUDA são calculados com base no número de multiprocessadores presentes na GPU, bem como no número de pistas ALU e na largura das pistas ALU.
Para minha GeForce GT 730 (DDR3, versão de 64 bits):
(2 multiprocessors * 192 64-bit ALU lanes) = 384 CUDA cores
A largura de banda da memória também é calculada com base no número de multiprocessadores na GPU:
(2 multiprocessors * 800 MHz) = 1600 MHz effective
Neste dispositivo, as operações de ponto flutuante de precisão simples são 24x mais rápidas do que as de precisão dupla. Isso pode variar dependendo da largura do barramento e do número de multiprocessadores, mas atualmente não tenho mais nada para comparar.