web-dev-qa-db-ja.com

メモリクロック/メモリ速度からメモリ帯​​域幅を取得する方法

参考までに、これが私がNvidiaから入手した仕様です

http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-680/specifications

http://www.geforce.com/hardware/desktop-gpus/geforce-gtx-titan/specifications

メモリ速度/メモリクロックは彼らのウェブサイトで同じものであり、両方ともGbpsで測定されることに注意してください。

ありがとう!

9
Blue_Black

Titanには384ビットバスがありますが、GTX 680には256しかないため、メモリ帯域幅が50%多くなります(クロックとレイテンシが同じであると仮定)。

編集:概念全体をもう少し説明しようと思います:以下は、RAM(だけでなく)のパフォーマンスを決定する要因の単純化されたモデルですグラフィックカード)。

ファクターA:頻度

RAMはクロック速度で実行されています。 RAM 1 GHzで実行 "ティック" 1,000,000,000(10億)回/ティック。ティックごとに、すべてのレーンで1ビットを送受信できます。したがって理論上のRAM 1GHzで実行されているメモリレーンが1つしかないモジュールは、1秒あたり125メガバイトを意味するバイトに8ビットがあるため、1秒あたり1ギガビットを配信します。

ファクターB:「ポンプレート」

DDR-RAM(ダブルデータレート)はティックあたり2ビットを配信でき、ティックあたり4ビットを配信する「クワッドポンプ」バスもありますが、後者がグラフィックカードで使用されていることは聞いたことがありません。

ファクターC:バス幅

RAMには、データを送信するための1つのレーンがあるだけではありません。 Intel4004でさえ4ビットバスを持っていました。リンクしたグラフィックカードには、それぞれ256のバスレーンと384のバスレーンがあります。

上記のすべての係数を乗算して、データを送受信できる理論上の最大値を計算します。

**バイト/秒単位の最大スループット=周波数*ポンプレート*バス幅/ 8 **

次に、リンクした2枚のグラフィックカードの計算を行います。どちらも同じタイプのRAM(ポンプレート2のGDDR5)を使用しているようで、どちらも3GHzで動作しています。

GTX-680: 3 Gbps * 2 * 256 / 8 = 192 GB/s

GTX-Titan: 3 Gbps * 2 * 384 / 8 = 288 GB/s

ファクターD:レイテンシー-または現実が始まる

この係数は、上記のすべてを組み合わせたものよりも計算が非常に困難です。基本的に、RAM "ねえ、このデータが欲しい"と言うと、答えが出るまでに時間がかかります。この待ち時間はさまざまな要因に依存し、非常に困難です。計算すると、通常はRAMシステムの配信が理論上の最大値よりもはるかに少なくなります。ここで、すべてのタイミング、プリフェッチ、その他の多くのものが登場します。数値だけではないためです。数字が大きいほど「より良い」という意味のマーケティングに使用されます。マーケティングの焦点は主に他のものにあります。不思議に思うかもしれませんが、GDDR5がメインボードにあるDDR3と異なるところがほとんどです。

22
Hazzit

から https://www.goldfries.com/computing/gddr3-vs-gddr5-graphic-card-comparison-see-the-difference-with-the-AMD-radeon-hd-7750/

memory clock in Hz×bus width÷8)×memory clock type multiplier =帯域幅(MB /秒)

どこ memory clock type multiplierは次のいずれかです。

HBM1/HBM2:2
GDDR3:2
GDDR5:4
GDDR5X:8

この記事の執筆時点で現在の最高級のグラフィックスカードの1つ、GDDR5Xメモリを使用するGTX 1080Tiを取り上げましょう。 techPowerUp! によると、このカードの仕様は次のとおりです。

メモリクロック:1376MHz
バス幅:352ビット
メモリタイプ:GDDR5X

これらの値を上記の式に代入すると、次のようになります。

(1376 * 352/8)* 8 = 484352 MB/s = 〜484 GB/s

同様に、古いGDDR5メモリを使用する GTX 107 の場合:

メモリクロック:2002MHz
バス幅:256ビット
メモリタイプ:GDDR5

(2002 * 256/8)* 4 = 256 256 MB/s = 〜256 GB/s

最後に、HBM1を使用するAMD FuryXの場合:

メモリクロック:500MHz
バス幅:4096ビット
メモリタイプ:HBM1

(500 * 4096/8)* 2 = 512 000 MB/s = 512 GB/s

そして Vega 64 これはHBM2を使用します:

メモリクロック:945MHz
バス幅:2048ビット
メモリタイプ:HBM2

(945 * 2048/8)* 2 = 483 840 MB/s = 〜484 GB/s

0
Ian Kemp

私は正しい計算がここで説明されていると思います:
https://www.goldfries.com/computing/gddr3-vs-gddr5-graphic-card-comparison-see-the-difference-with-the-AMD-radeon-hd-7750 /

要するに:
"(メモリクロックxバス幅/ 8)* GDDRタイプの乗数=帯域幅(GB /秒)

GDDRタイプの乗数は、GDDR3の場合は2、GDDR5の場合は4です。」

そこにはもっと多くの詳細があり、非常によく説明され、詳細に説明されています。

0
VeganEye