web-dev-qa-db-ja.com

intel-gpu-topお​​よびintel-gpu-overlayの出力をどのように解釈しますか?

これらのコマンドをコンパイルして実行していますが、その内容は少し謎です。

intel-gpu-overlayのプロセスは、15R, 16B, 41ms waitsのようなものを読み取ります。 Rとは何ですか、Bとは何ですか、その待ち時間は何を示していますか?

それはCPUを持っています:152%(これは私が上から取得するものと同じだと思います)。レンダリング:32%、ビットストリーム:6%、blt:6%。これらの値がボトルネックになる原因となるコードの種類と、それらが発生したときのシステムの動作は何ですか?

以下は、intel-gpu-topのサンプルです。

               render busy:  23%: ████▋                                  render space: 12/16384

                      task  percent busy
                       GAM:  29%: █████▉                  vert fetch: 1380772913 (5386667/sec)
                        CS:  23%: ████▋                   prim fetch: 350972637 (1368891/sec)
                      GAFS:   9%: █▉                   VS invocations: 1375586768 (5385212/sec)
                       TSG:   8%: █▋                   GS invocations: 0 (0/sec)
                       VFE:   7%: █▌                        GS prims: 0 (0/sec)
                       SVG:   3%: ▋                    CL invocations: 677098924 (2648400/sec)
                        VS:   3%: ▋                         CL prims: 682224019 (2663834/sec)
                      URBM:   2%: ▌                    PS invocations: 9708568482932 (34396218804/sec)
                        VF:   2%: ▌                    PS depth pass: 15549624948405 (58732230331/sec)
                       SDE:   0%:                      
                        CL:   0%:                      
                        SF:   0%:                      
                       TDG:   0%:                      
                        RS:   0%:                      
                      GAFM:   0%:                      
                       SOL:   0%:
10
mpr

OPのコメントに記載されているリンクから取得。

私も興味があったので、ここでは リファレンスマニュアル から取得できることをいくつか紹介します。 intel-gpu-tools source 、特にlib/instdone.cも重要です。これは、すべてのIntel GPUモデルで表示される内容を示しています。 このパッチ は、これらすべての頭字語の翻訳にも非常に役立ちました。

いくつかは間違っているかもしれませんが、より知識のある誰かがチャイムできればそれが大好きです!このことを学んだら、答えを更新するために戻ってきます。

まず、右側の3行:

  • render spaceは、通常の3D操作でおそらく使用されます。
  • グーグルから、bitstreamはオーディオのデコードについてのようです?これはかなり一般的な用語なので、クエリで見つけるのは困難です。ただし、私のGPU(Skylake HD 530)には表示されないため、どこにも表示されない場合があります。
  • blitterは、vol。 11と2D操作(ブリッティング)のハードウェアアクセラレーションに責任があるようです。

固定機能(FF)パイプラインユニット(旧式のGPU機能):

  • VF:Vertex Fetcher(vol。1)、メモリから頂点データをフェッチする3Dパイプラインの最初のFFユニット。
  • VS:Vertex Shader(vol.1)、GPUによって描画された各プリミティブの頂点について計算します。 GPUでのかなり標準的な操作。
  • HS:ハルシェーダー
  • TE:テッセレーションエンジン
  • DS:ドメインシェーダー
  • GS:ジオメトリシェーダー
  • SOL:ストリーム出力ロジック
  • CL:クリップユニット
  • SF:ストリップとファン(vol.1)、ストリップとファンなどのプリミティブトポロジをプリミティブまたはオブジェクトに分解することを主な機能とするFFユニット。

FFユニットとGPGPUの両方のスレッドとパイプラインの管理に使用されるユニット( Intel Open Source HD Graphics Programmers Manual を参照してくださいlotこれがどのように機能するかについての情報):

  • CS:Command Streamer(vol.1)、コマンドをフェッチして解析し、適切なパイプラインにルーティングするグラフィックスプロセッシングエンジンの機能単位。
  • TDG:スレッドディスパッチャー
  • VFE:ビデオフロントエンド
  • TSG:Thread Spawner
  • URBM:Unified Return Buffer Manager

他のもの :

  • GAM:GFXページウォーカー(vol。5)を参照、メモリアービターとも呼ばれる、GPUがメモリページを追跡する方法に関係し、 [〜#〜] tlb [〜#〜] と非常によく似ています( [〜も参照) #〜] slat [〜#〜] )は、RAMに使用します。
  • SDE:South Display Engine;巻によると。 12、「サウスディスプレイエンジンは、ホットプラグ検出、GPIO、GMBUS、パネル電源シーケンス、およびバックライト変調をサポートしています。」.

クレジット:

StackOverflowユーザーF.X。

4
George Udosen