Por que uma placa Geforce tem desempenho 4x mais lento em precisão dupla do que uma placa Tesla?

Por que uma placa Geforce tem desempenho 4x mais lento em precisão dupla do que uma placa Tesla?

Já vi isso mencionado em vários lugares. Da Wikipédia:

Para uma saída de precisão única equivalente, as placas nVidia Geforce baseadas em Fermi têm quatro vezes menos desempenho de precisão dupla [do que as placas Tesla].

Já ouvi explicações vagas envolvendo um 'multiplicador'. Envolve algo com deficiência física no equivalente Geforce morre?

Responder1

É a diferença entre ter operações de precisão dupla implementadas em hardware e ter que fazer uma operação de precisão dupla como quatro operações de precisão simples.

Por exemplo, considere multiplicar “16” por “43”. Se você tivesse um multiplicador nativo de dois dígitos, faria isso em uma operação. Se você tivesse apenas um multiplicador de um dígito, precisaria multiplicar 1 por 4, 1 por 3, 6 por 4 e 6 por 3 para fazer isso. Assim:

   16
 X 43
 ----
   18 (6*3)
   3  (3*1)
  24  (4*6)
  4   (4*1)
-----
  688

Observe que você precisava fazer4multiplicações de um dígito para fazer uma multiplicação de dois dígitos, então leva quatro vezes mais tempo. Portanto, se você não tiver um multiplicador de precisão dupla, mas tiver apenas um, levará quatro vezes mais tempo para fazer uma multiplicação de precisão dupla.

informação relacionada