私はオブジェクト検出器をトレーニングしていて、評価ジョブを実行しました。テンソルボードに特定のグラフが表示されます。示されているように、テンソルフローボードのDetectionBoxes_Recall/AR @ 10 vs AR @ 100 vs AR @ 100(medium)とは何ですか。そして、DetectionBoxes_Precision/mAP、mAP(large)、mAP(medium)、mAP(small)、mAP(0.50IOU)、mAP(0.75IOU)の違いは何ですか?私がこれに非常に新しいのを手伝ってくださいありがとう。
'DetectionBoxes_Precision/mAP':。05から.95までの範囲のIOUしきい値で平均化されたクラスの平均精度。
'DetectionBoxes_Precision/mAP @ .50IOU':50%IOUでの平均精度
'DetectionBoxes_Precision/mAP @ .75IOU':75%IOUでの平均精度
'DetectionBoxes_Precision/mAP(small)':小さなオブジェクト(面積<32 ^ 2ピクセル)の平均精度。
'DetectionBoxes_Precision/mAP(medium)':中サイズのオブジェクトの平均精度(32 ^ 2ピクセル<領域<96 ^ 2ピクセル)。
'DetectionBoxes_Precision/mAP(large)':大きなオブジェクトの平均精度(96 ^ 2ピクセル<領域<10000 ^ 2ピクセル)。
'DetectionBoxes_Recall/AR @ 1':1回の検出での平均リコール。
'DetectionBoxes_Recall/AR @ 10':10回の検出による平均リコール。
'DetectionBoxes_Recall/AR @ 100':100回の検出による平均リコール。
'DetectionBoxes_Recall/AR @ 100(small)':100の小さなオブジェクトの平均リコール。
'DetectionBoxes_Recall/AR @ 100(medium)':100のミディアムオブジェクトの平均リコール。
'DetectionBoxes_Recall/AR @ 100(large)':100回検出されたラージオブジェクトの平均リコール。
@kmhが指摘したように、簡単な(しかし素晴らしいとは言えない)説明が見つかります ここ 。実際の数学的定義は、コード ここ にあります。
mAP =平均平均適合率mAR =平均平均再現率
彼らが平均平均と言うとき、特に明記しない限り、それらはすべての例(すなわち画像)、クラス、およびIOUしきい値(範囲.50:.05:.95、すなわち[0.5、0.55)にわたってこれらのメトリックを計算していることを意味します、...、0.90、0.95])。
したがって、これらの12のメトリックについて:
精度(mAP)
DetectionBoxes_Precision/mAP:上記で説明したように、これは、すべての画像、クラス、およびIOUしきい値の精度を計算してから、平均を取ることを意味します。
DetectionBoxes_Precision/mAP @ .50IOU:ここでは、IOUを指定しているため、この場合、すべてのIOUしきい値を超えるのではなく、指定されたしきい値のみを超えます。 。このメトリックは、IOU = 0.5のみを使用した平均精度です(ただし、すべての画像とクラスを対象としています)。このメトリックの考え方は、バウンディングボックスの位置についてそれほど厳密でない場合に、大まかな精度を提供することです(正としてカウントするには、少なくともIOU = 0.5が必要です)。
DetectionBoxes_Precision/mAP @ .75IOU:上記と同じですが、IOU = 0.5の代わりにIOU = 0.75を使用します。このメトリックの考え方は、バウンディングボックスの位置についてある程度厳密な場合に、大まかな精度を提供することです(正としてカウントするには、少なくともIOU = 0.75が必要です)。
DetectionBoxes_Precision/mAP(small、medium、large)これらは基本的に上記のmAPと同じですが、境界ボックスのサイズによってスライスされます。小さいものは、小さい(面積<32 * 32ピクセル)境界ボックスのmAPのみを計算しています。 Mediumは、32 * 32 <領域<96 * 96の境界ボックス用です。 Largeはエリア> 96 * 96の場合です(実際には、largeの実装は96 * 96 <エリア<1e5 * 1e5です)。これらのメトリックを使用すると、特定のサイズのバウンディングボックスでモデルのパフォーマンスが向上/低下しているかどうかを把握できます。
リコール(mAR)
DetectionBoxes_Recall/AR @(1、10、100):これらは、画像内の検出数でスライスされた平均リコールです。 AR @ 1は、最大1つの検出(つまり、0または1)、すべてのクラス、およびすべてのIOUしきい値にわたって、すべての画像の平均再現率を計算することを意味します。 AR @ 10の場合も同じですが、すべての画像で最大10回の検出が行われます(つまり、0 <= n <= 10)。 AR @ 100は、最大100個の検出用です。
DetectionBoxes_Recall/AR @ 100(small、medium、large):これらは、検出されたバウンディングボックスのサイズでスライスされた平均リコールです。メトリックのAR @ 100に注目してください。これは、最大100回の検出でのみ画像を取得することを意味します(一般に、これはほとんどまたはすべての画像を意味します)。サイズは上記のmAPと同じです(つまり、小:[0、32 * 32]、中:[32 * 32、96 * 96]、大:[96 * 96、1e5 * 1e5])