Сравнение характеристик GT 730: ядра CUDA; 64/128 бит; DDR3/GDDR5, МГц, пропускная способность, 1 ГБ/2 ГБ

Question 1

Интересно, почему в 64-битной версии 2 ГБ, а не 1 ГБ? >В то время как в 128-битной версии 1 ГБ.

Это почти наверняка связано с тем, что у графического процессора есть два контроллера памяти.

Вы получаете либо два 64-битных канала, каждый из которых может использовать 1 ГБ памяти, либо один 128-битный канал, который может использовать одну область памяти объемом 1 ГБ.

Интересно, почему версия GDDR5 имеет 1 ГБ, а не 2 ГБ? >В то время как версия DDR3 имеет 2 ГБ.

Вероятно, потому что дополнительная пропускная способность, предоставляемая GDDR5, требует некоторого внутреннего мультиплексирования в GPU, что ограничивает его одним каналом памяти. Настоящая причина будет известна только разработчикам GPU и самой Nvidia.

Также интересно, производительность 64-битной карты 4 ГБ такая же, как у 128-битной карты 2 ГБ? Или производительность 64-битной карты 2 ГБ такая же, как у 128-битной карты 1 ГБ?

Нет. "Битовость" памяти влияет на эффективную доступную пропускную способность памяти. Посмотрите на рисунок чуть ниже ширины интерфейса памяти.

Графические задачи, как правило, невероятно ограничены памятью, большая пропускная способность памяти, как правило, означает, что она будет работать лучше. Даже тогда могут быть задачи, где карта с меньшей пропускной способностью и большей памятью может работать лучше, чем карта с меньшей памятью, но большей пропускной способностью.

Вы сравниваете сорняки среди нескольких (честно говоря) очень плохих карт, и я серьезно сомневаюсь, что вы увидите существенную разницу в производительности между ними.

Почему: дифференциация продукта и потому что они могут.

Answer

Интересно, почему в 64-битной версии 2 ГБ, а не 1 ГБ? >В то время как в 128-битной версии 1 ГБ.

Это почти наверняка связано с тем, что у графического процессора есть два контроллера памяти.

Вы получаете либо два 64-битных канала, каждый из которых может использовать 1 ГБ памяти, либо один 128-битный канал, который может использовать одну область памяти объемом 1 ГБ.

Интересно, почему версия GDDR5 имеет 1 ГБ, а не 2 ГБ? >В то время как версия DDR3 имеет 2 ГБ.

Вероятно, потому что дополнительная пропускная способность, предоставляемая GDDR5, требует некоторого внутреннего мультиплексирования в GPU, что ограничивает его одним каналом памяти. Настоящая причина будет известна только разработчикам GPU и самой Nvidia.

Также интересно, производительность 64-битной карты 4 ГБ такая же, как у 128-битной карты 2 ГБ? Или производительность 64-битной карты 2 ГБ такая же, как у 128-битной карты 1 ГБ?

Нет. "Битовость" памяти влияет на эффективную доступную пропускную способность памяти. Посмотрите на рисунок чуть ниже ширины интерфейса памяти.

Графические задачи, как правило, невероятно ограничены памятью, большая пропускная способность памяти, как правило, означает, что она будет работать лучше. Даже тогда могут быть задачи, где карта с меньшей пропускной способностью и большей памятью может работать лучше, чем карта с меньшей памятью, но большей пропускной способностью.

Вы сравниваете сорняки среди нескольких (честно говоря) очень плохих карт, и я серьезно сомневаюсь, что вы увидите существенную разницу в производительности между ними.

Почему: дифференциация продукта и потому что они могут.

Question 2

Ядра CUDA рассчитываются на основе количества мультипроцессоров, присутствующих в графическом процессоре, а также количества полос ALU и ширины полос ALU.

Для моей GeForce GT 730 (DDR3, 64-битная версия):

(2 multiprocessors * 192 64-bit ALU lanes) = 384 CUDA cores

Пропускная способность памяти также рассчитывается на основе количества мультипроцессоров на графическом процессоре:

(2 multiprocessors * 800 MHz) = 1600 MHz effective

На этом устройстве операции с плавающей точкой одинарной точности в 24 раза быстрее, чем двойной точности. Это может зависеть от ширины шины и количества мультипроцессоров, но сейчас мне не с чем сравнивать.

Answer

Ядра CUDA рассчитываются на основе количества мультипроцессоров, присутствующих в графическом процессоре, а также количества полос ALU и ширины полос ALU.

Для моей GeForce GT 730 (DDR3, 64-битная версия):

(2 multiprocessors * 192 64-bit ALU lanes) = 384 CUDA cores

Пропускная способность памяти также рассчитывается на основе количества мультипроцессоров на графическом процессоре:

(2 multiprocessors * 800 MHz) = 1600 MHz effective

На этом устройстве операции с плавающей точкой одинарной точности в 24 раза быстрее, чем двойной точности. Это может зависеть от ширины шины и количества мультипроцессоров, но сейчас мне не с чем сравнивать.

Сравнение характеристик GT 730: ядра CUDA; 64/128 бит; DDR3/GDDR5, МГц, пропускная способность, 1 ГБ/2 ГБ

решение1

решение2

Связанный контент