トップ GeForceビデオカードには480GUDAがあります コア (60マルチコア×8ストリーム)。これらは汎用CPUに似ていますが、特殊な命令、レジスタ、およびメモリ動作モードを備えており、浮動小数点処理を対象としています。
Top Radeonビデオカードは通常、GeForceカードよりも速度が遅くなります(2分の1の価格です!)。ただし、公式の仕様では、1408 ストリームプロセッサ および22-24 SIMDエンジン (それぞれ16ストリーム)であると記載されています。
ストリームプロセッサとは何ですか?SIMDエンジンはどういう意味ですか? SIMDエンジンはCUDAコアのようなものですか? ストリームプロセッサはALUとまったく同じですか?
いくつかのAMDプレゼンテーションから:
各SIMDユニットには16個のストリームコアが含まれ、各ストリームコアには5個の処理要素が含まれています。したがって、ATI Radeon HD 5870の各計算ユニットには80(16×5)の処理要素があります。
CUDAコアのアナログはストリームコアであり、SIMDユニットはnVidiaのストリーミングマルチプロセッサのアナログです。
CUDAコアとStreamコアの違いは、CUDAコアは1つのプロセッサで構成されていますが、一度に1つの操作しか実行できず、Streamコアには5つのプロセッサがあり、最大4つの「単純な」操作(加算/など)を同時に実行できることです。乗算)、ただしベクトルタイプ(int4
、float4
など)のみ。スカラータイプの場合、この5つのプロセッサのうち4つは、1つがすべての作業を行う間待機します。
パフォーマンスの主な違いは、コアの数によるものではなく、このコアの作成方法によるものです。 nVidiaのGPUは、ATIのGPUが整数演算およびビット演算の分野で卓越しており、暗号化に使用される場合、浮動小数点演算に適しています(したがって、ほとんどの科学アプリケーションで使用されます)。