web-dev-qa-db-ja.com

CUDA計算のためのワークステーションとデスクトップGPUのパフォーマンスの違いは何ですか?

ワークステーションとデスクトップのGPUカードを比較すると、2つのカードの実際の違いは明らかではありません。ワークステーションカードはプロ用で、デスクトップカードはゲーム用であることを理解していますが、それはCUDA計算にとって何を意味しますか?私が見た投稿はCADと3Dレンダリングに焦点を当てているようです。私は [〜#〜] cuda [〜#〜 ] Linuxシステムのコア。

同様の価格の2枚のカードを比較すると、デスクトップカードは2倍のCUDAコアと50%多くのメモリを提供します。

  1. Quadro K4200は現在 789 $ に誇りを持っています
    • 1344CUDAコア
    • 4GB256ビットGDDR5
  2. GeForce GTX 980 Tiの現在の価格は 699 $
    • 2816CUDAコア
    • 6 GB384ビットGDDR5

考慮すべき他の違いはありますか?

3

どちらのカードにも長所と短所があります。

GTXのパフォーマンスははるかに優れています。
http://gpu.userbenchmark.com/Compare/Nvidia-Quadro-K4200-vs-Nvidia-GTX-980/2838vs2576

GTX 980は、新しい第2世代のMaxwellアーキテクチャに基づいています。つまり、Quadro K4200(最新のQuadroラインナップの一部であるにもかかわらず、第1世代のKeplerアーキテクチャに基づいています)よりも新しいテクノロジをサポートする可能性が高くなります。

Quadroについて:

そこで、Nvidia Quadro K4200を購入するつもりでした。そのドライバーは、より優れたビューポートパフォーマンスをサポートしていると言われたからです。ただし、さまざまなフォーラムの多くのユーザーが、ビューポートのパフォーマンスの向上に感銘を受けておらず、無視できると言っているのを目にしました。彼らは「GTX-has-much-better-specs-for-the-price」キャンプにいました。 「チームGTX」

それから、スペックはまったく関係なく、それは「すべてがドライバーにある」という視点を持つ人々を見てきました。 (「TeamQuadro」)彼らは、Quadroの優れたドライバーがMaxワークフローに劇的な違いをもたらし、高額な価格の価値があると宣言しています。また、ハードウェアにも重要な違いがあり、最適化されたQuadro /スロットルGTXドライバーだけではないとも言われています。

「TeamGTX」は、これが真実であると主張しますが、QuadroとGTXは近年収束しています。彼らは、オンラインでのベンチマークやディスカッションの多くが時代遅れであるか(たとえば、Quadro NON-Keplerシリーズを比較)、またはクロスオーバーなしでゲームカード/ワークステーションカードだけを比較するだけであるかについての逸話を示しています。私は、GTX980が大幅に優れていることを示す直接のベンチマークサイトを使用しました。しかし、繰り返しになりますが、ベンチマークはゲーマーを対象としているようです。

さらに複雑なのは、GTX970/980とTitanです。私にとって価格を正当化するためにタイタンが提供する利点はほとんどないようです。

ソース

参照:

GTX 900シリーズグラフィックカードは、NvidiaがMicrosoft for Windows(WHQL-Windows Hardware Quality Labs)で行うようにnvidiaドライバーを取得し、Adobe SIGNED GTX 900 DRIVERSとして認定するために、AdobeDevelopersから現在サポートされていません...今のところGTX900 GPU CUDAAPIとGPUに基づいて実際に動作するGTX980のGM204isnideは、Maxwellの改善なしで動作しますが、古いFermiまたはKeplerとして反応します。

今のところ、HP Z840、Precision T7810、Celsius R940、Thinkstation P900などのすべての獣はQuadroカードに基づいています。これは、このGPUに署名されたドライバーが、こことAEおよびPR用のビデオのデコーダーとエンコーダーを含むすべてのメディアのISV認定を取得しているためです。

多くのGpixel/sまたはGtexel/sまたは多くのメモリ帯域幅を持つGPUを選択することは重要ではありません(それらは重要です..)... Quadro 2000/4000 /のような最初の認定GPUを選択してください5000/6000低予算になり、Quadro K 2000/2200/4000/4200/5000/5200またはAEおよびPR、GTX 780、GTX Titan、GTX 780Tiの認定を受けた特別なゲームGPU。仕様を参照してください。

ソース

同様の質問には、はるかに詳細な説明があります。

一般に:

  1. TeslaまたはQuadroよりも多くのメモリが必要な場合。消費者向けカードATMの最大容量は1.5Gb(GTX 480)ですが、テスラとクアドロスの最大容量は6Gbです。

  2. GF10xシリーズカードの倍精度(FP64)パフォーマンスは、単精度(FP32)パフォーマンスの1/8に制限されていますが、アーキテクチャは1/2に対応しています。さらに別の市場細分化のトリックであり、今日ではハードウェアメーカーの間で非常に人気があります。 GeForceラインを壊すことは、HPCでTeslaラインに利点を与えることを目的としています。 GTX 480は、実際にはTesla20x0よりも高速です-1.34TFlops対1.03TFlops、177.4Gb対144Gb /秒(ピーク)。

  3. TeslaとQuadroは(想定される)より徹底的にテストされているため、ゲームとはほとんど関係のないエラーが発生する可能性は低くなりますが、科学計算に関しては、1ビットの反転だけで結果が損なわれる可能性があります。 NVIDIAは、Teslaカードは24時間年中無休で使用できるQC-dであると主張しています。

最近の論文(Haque and Pande、ソフトエラーに関するハードデータ:GPGPUでの実際のエラー率の大規模評価)は、テスラが実際にエラーを起こしにくいことを示唆しています。

  1. 私の経験では、GeForceカードは、特に一定の高負荷では、信頼性が低くなる傾向があります。適切な冷却は非常に重要であり、工場でオーバークロックされたモデルを含むオーバークロックされたカードを回避することも重要です。

ソース

この投稿 のコメントセクションにもこれに関する議論があります

CUDAを使用した汎用GPUコンピューティングには明らかなパフォーマンスの違いがあります。 GeForcesは倍精度演算をサポートしていますが、そのパフォーマンスは1/8の単精度パフォーマンスで人為的に制限されているように見えますが、Quadrosは予想どおり単精度パフォーマンスの1/2を取得します。免責事項:これは中古の知識です。私はCUDAを自分で行いません。一方、OpenGLでは、QuadrosとGeForcesの両方が単精度演算のみを使用します。これは、レンダリングノードを実行しているQuadrosが、通常のGeForceと同じように、大規模なモデルデータを操作するときに、まったく同じ丸めの問題を示すCAVEの観察に基づいています。幸いなことに、回避策があります。

Stvn66が見つけてまとめるもう1つの便利なリンク:
https://www.pugetsystems.com/labs/articles/GTX-980-Ti-Linux-CUDA-performance-vs-Titan-X-and-GTX-980-659/

3
Divin3