私は読んでいますNvLink 仕様そして、表にはこう書いてある
Semiconductor|Interconnect| Sublink data-rate per data direction | Total data rate (out+in)
Nvidia V100 |NVLink 2.0 | 200 Gbit/s = 25 GByte/s | 300 GByte/s
これはNVLinkが25GB/sの出力しかできないことを意味するのでしょうか?1つ方向(例:GPUへの入力)は?GPU(例:最新のRTX 2080) の帯域幅は 616 GB/秒と記載されていますが、その 616 GB のうちメモリ転送に使用できるのは 25 GB だけということでしょうか?
答え1
つまり、616 のうち 25 GB しかメモリ転送に使用できないということですか?
いいえ、あなたが引用した制限は、Nvidia の以前の世代の GPU (Volta) に適用されました。現在の世代 (Turing) には適用されません。
これは、NVLink が一方向 (GPU への入力など) に 25 GB/秒の出力しかできないことを意味しますか?
同じ記事のさらに下の方では、NVLink のアーキテクチャが詳しく説明されており、リンクあたり 25 GB/秒になります。Nvidia V100 に Nvidia P100 (Pascal) と同じ制限がある場合、合計でアップロードが 150 GB/秒、ダウンロードがさらに 150 GB/秒になります。
各 NVLink (リンク インターフェイス) は双方向 20 GB/秒 (上り)、20 GB/秒 (下り) を提供し、GP100 GPU ごとに 4 つのリンクがあるため、合計帯域幅は上り 80 GB/秒、下り 80 GB/秒になります。