Интересно, почему nVidia предлагает такие конфигурации своих видеокарт, в данном случае > GT730.
Я знаю, bandwidth = Memory clock x Memory interface width
но как насчет конфигурации памяти или ядер CUDA? Где они вступают в игру?
- Интересно, почему в 64-битной версии 2 ГБ, а не 1 ГБ? (а в 128-битной версии 1 ГБ).
- Интересно, почему у версии GDDR5 1 ГБ, а не 2 ГБ? (а у версии DDR3 2 ГБ).
- Интересно, почему версия GDDR5 имеет 64 бита, а не 128 бит? (а версия DDR3 имеет 128).
Также интересно, 64-битная 4 ГБ карта работает так же, как 128-битная 2 ГБ карта? Или 64-битная 2 ГБ версия работает так же, как 128-битная 1 ГБ карта?
решение1
Интересно, почему в 64-битной версии 2 ГБ, а не 1 ГБ? >В то время как в 128-битной версии 1 ГБ.
Это почти наверняка связано с тем, что у графического процессора есть два контроллера памяти.
Вы получаете либо два 64-битных канала, каждый из которых может использовать 1 ГБ памяти, либо один 128-битный канал, который может использовать одну область памяти объемом 1 ГБ.
Интересно, почему версия GDDR5 имеет 1 ГБ, а не 2 ГБ? >В то время как версия DDR3 имеет 2 ГБ.
Вероятно, потому что дополнительная пропускная способность, предоставляемая GDDR5, требует некоторого внутреннего мультиплексирования в GPU, что ограничивает его одним каналом памяти. Настоящая причина будет известна только разработчикам GPU и самой Nvidia.
Также интересно, производительность 64-битной карты 4 ГБ такая же, как у 128-битной карты 2 ГБ? Или производительность 64-битной карты 2 ГБ такая же, как у 128-битной карты 1 ГБ?
Нет. "Битовость" памяти влияет на эффективную доступную пропускную способность памяти. Посмотрите на рисунок чуть ниже ширины интерфейса памяти.
Графические задачи, как правило, невероятно ограничены памятью, большая пропускная способность памяти, как правило, означает, что она будет работать лучше. Даже тогда могут быть задачи, где карта с меньшей пропускной способностью и большей памятью может работать лучше, чем карта с меньшей памятью, но большей пропускной способностью.
Вы сравниваете сорняки среди нескольких (честно говоря) очень плохих карт, и я серьезно сомневаюсь, что вы увидите существенную разницу в производительности между ними.
Почему: дифференциация продукта и потому что они могут.
решение2
Ядра CUDA рассчитываются на основе количества мультипроцессоров, присутствующих в графическом процессоре, а также количества полос ALU и ширины полос ALU.
Для моей GeForce GT 730 (DDR3, 64-битная версия):
(2 multiprocessors * 192 64-bit ALU lanes) = 384 CUDA cores
Пропускная способность памяти также рассчитывается на основе количества мультипроцессоров на графическом процессоре:
(2 multiprocessors * 800 MHz) = 1600 MHz effective
На этом устройстве операции с плавающей точкой одинарной точности в 24 раза быстрее, чем двойной точности. Это может зависеть от ширины шины и количества мультипроцессоров, но сейчас мне не с чем сравнивать.