¿Por qué una tarjeta Geforce funciona 4 veces más lento en doble precisión que una tarjeta Tesla?

¿Por qué una tarjeta Geforce funciona 4 veces más lento en doble precisión que una tarjeta Tesla?

He visto esto mencionado en varios lugares. De Wikipedia:

Para una salida de precisión simple equivalente, las tarjetas nVidia Geforce basadas en Fermi tienen cuatro veces menos rendimiento de precisión dual [que las tarjetas Tesla].

He escuchado explicaciones vagas que involucran un "multiplicador". ¿Se trata de algo físicamente discapacitado en el equivalente de Geforce?

Respuesta1

Es la diferencia entre tener operaciones de doble precisión implementadas en hardware y tener que realizar una operación de doble precisión como cuatro operaciones de precisión simple.

Por ejemplo, considere multiplicar "16" por "43". Si tuvieras un multiplicador nativo de dos dígitos, lo harías en una sola operación. Si solo tuvieras un multiplicador de un solo dígito, necesitarías multiplicar 1 por 4, 1 por 3, 6 por 4 y 6 por 3 para hacerlo. Como esto:

   16
 X 43
 ----
   18 (6*3)
   3  (3*1)
  24  (4*6)
  4   (4*1)
-----
  688

Note que necesitaba hacer4multiplicaciones de un solo dígito para hacer una multiplicación de dos dígitos, por lo que lleva cuatro veces más tiempo. Entonces, si no tienes un multiplicador de doble precisión pero solo tienes uno, te llevará cuatro veces más tiempo hacer una multiplicación de doble precisión.

información relacionada