Я видел упоминания об этом в разных местах. Из Википедии:
При эквивалентном выводе одинарной точности видеокарты nVidia Geforce на базе Fermi имеют в четыре раза меньшую производительность при двойной точности [чем видеокарты Tesla].
Я слышал расплывчатые объяснения, связанные с «множителем». Имеется ли в виду что-то физически отключенное в эквивалентных кристаллах Geforce?
решение1
В этом разница между аппаратной реализацией операций с двойной точностью и необходимостью выполнять операцию с двойной точностью в виде четырех операций с одинарной точностью.
Например, рассмотрим умножение "16" на "43". Если бы у вас был собственный двузначный множитель, вы бы сделали это за одну операцию. Если бы у вас был только однозначный множитель, вам пришлось бы умножить 1 на 4, 1 на 3, 6 на 4 и 6 на 3, чтобы сделать это. Вот так:
16
X 43
----
18 (6*3)
3 (3*1)
24 (4*6)
4 (4*1)
-----
688
Обратите внимание, что вам нужно было сделать4умножения однозначных чисел для выполнения одного двузначного умножения, поэтому это занимает в четыре раза больше времени. Таким образом, если у вас нет множителя двойной точности, а есть только одинарный, вам потребуется в четыре раза больше времени, чтобы выполнить умножение двойной точности.