Geforce 카드가 Tesla 카드보다 배정밀도 성능이 4배 느린 이유는 무엇입니까?

Geforce 카드가 Tesla 카드보다 배정밀도 성능이 4배 느린 이유는 무엇입니까?

나는 이것이 여러 곳에서 언급되는 것을 보았습니다. 위키피디아에서:

동등한 단정밀도 출력의 경우 Fermi 기반 nVidia Geforce 카드는 [Tesla 카드보다] 이중 정밀도 성능이 4배 낮습니다.

'승수'와 관련된 모호한 설명을 들었습니다. 동등한 Geforce 사망에 신체적 장애가 있는 것과 관련이 있습니까?

답변1

하드웨어에서 이중 정밀도 연산을 구현하는 것과 4개의 단정밀도 연산으로 이중 정밀도 연산을 수행해야 하는 것의 차이점입니다.

예를 들어, "16"에 "43"을 곱하는 것을 고려해 보세요. 기본 두 자릿수 곱셈기가 있는 경우 한 번의 작업으로 수행할 수 있습니다. 한 자리 승수만 있는 경우 1을 4로, 1을 3으로, 6을 4로, 6을 3으로 곱해야 합니다. 이와 같이:

   16
 X 43
 ----
   18 (6*3)
   3  (3*1)
  24  (4*6)
  4   (4*1)
-----
  688

당신이해야 할 일에 주목하십시오4한 자리 곱셈은 두 자리 곱셈을 한 번 하기 때문에 4배의 시간이 걸립니다. 따라서 쌍정밀도 곱셈기는 없고 단일 곱셈기만 있는 경우 배정밀도 곱셈을 수행하는 데 4배의 시간이 걸립니다.

관련 정보