Warum ist die Leistung einer Geforce-Karte bei doppelter Genauigkeit 4x langsamer als die einer Tesla-Karte?

Warum ist die Leistung einer Geforce-Karte bei doppelter Genauigkeit 4x langsamer als die einer Tesla-Karte?

Ich habe dies an verschiedenen Stellen erwähnt gesehen. Aus Wikipedia:

Bei gleichwertiger Ausgabe mit einfacher Genauigkeit weisen Fermi-basierte nVidia Geforce-Karten eine viermal geringere Leistung mit doppelter Genauigkeit auf [als Tesla-Karten].

Ich habe vage Erklärungen gehört, in denen es um einen „Multiplikator“ geht. Handelt es sich dabei um etwas, das in den entsprechenden Geforce-Chips physisch deaktiviert ist?

Antwort1

Es handelt sich um den Unterschied zwischen der Implementierung von Operationen mit doppelter Genauigkeit in der Hardware und der Ausführung einer Operation mit doppelter Genauigkeit als vier Operationen mit einfacher Genauigkeit.

Betrachten wir beispielsweise die Multiplikation von „16“ mit „43“. Wenn Sie einen nativen zweistelligen Multiplikator hätten, würden Sie dies in einem einzigen Vorgang erledigen. Wenn Sie nur einen einstelligen Multiplikator hätten, müssten Sie 1 mit 4, 1 mit 3, 6 mit 4 und 6 mit 3 multiplizieren, um dies zu tun. So:

   16
 X 43
 ----
   18 (6*3)
   3  (3*1)
  24  (4*6)
  4   (4*1)
-----
  688

Beachten Sie, dass Sie tun mussten4einstellige Multiplikationen, um eine zweistellige Multiplikation durchzuführen, also dauert es viermal so lange. Wenn Sie also keinen Multiplikator mit doppelter Genauigkeit haben, sondern nur einen mit einfacher Genauigkeit, dauert es viermal so lange, eine Multiplikation mit doppelter Genauigkeit durchzuführen.

verwandte Informationen