Почему карта Geforce работает в 4 раза медленнее при обработке чисел двойной точности, чем карта Tesla?

Почему карта Geforce работает в 4 раза медленнее при обработке чисел двойной точности, чем карта Tesla?

Я видел упоминания об этом в разных местах. Из Википедии:

При эквивалентном выводе одинарной точности видеокарты nVidia Geforce на базе Fermi имеют в четыре раза меньшую производительность при двойной точности [чем видеокарты Tesla].

Я слышал расплывчатые объяснения, связанные с «множителем». Имеется ли в виду что-то физически отключенное в эквивалентных кристаллах Geforce?

решение1

В этом разница между аппаратной реализацией операций с двойной точностью и необходимостью выполнять операцию с двойной точностью в виде четырех операций с одинарной точностью.

Например, рассмотрим умножение "16" на "43". Если бы у вас был собственный двузначный множитель, вы бы сделали это за одну операцию. Если бы у вас был только однозначный множитель, вам пришлось бы умножить 1 на 4, 1 на 3, 6 на 4 и 6 на 3, чтобы сделать это. Вот так:

   16
 X 43
 ----
   18 (6*3)
   3  (3*1)
  24  (4*6)
  4   (4*1)
-----
  688

Обратите внимание, что вам нужно было сделать4умножения однозначных чисел для выполнения одного двузначного умножения, поэтому это занимает в четыре раза больше времени. Таким образом, если у вас нет множителя двойной точности, а есть только одинарный, вам потребуется в четыре раза больше времени, чтобы выполнить умножение двойной точности.

Связанный контент