検索エンジンでのリコールの意味は知っていますが、分類子のリコールの意味は何ですか?ベイズ分類器?例を挙げてください、ありがとう。
たとえば、Precision =テストデータの正しい/正しい+間違ったドキュメント。リコールを理解する方法は?
文字通りリコールはtrueポジティブの数がリコールされた )(found)、つまり、正しいヒットがいくつ見つかったか。
精度(式が正しくありません)は返されたヒットの数がtrueポジティブつまり、見つかったもののうち、正しいヒットがいくつあったか。
実際、それはかなり簡単です。
ウィキペディアの 適合率と再現率 の説明が非常に役立つことがわかりました。
写真で犬を認識するためのコンピュータプログラムが、12匹の犬と数匹の猫を含む写真で8匹の犬を識別すると仮定します。識別された8匹の犬のうち、5匹は実際には犬(真陽性)であり、残りは猫(偽陽性)です。プログラムの精度は5/8ですが、リコールは5/12です。検索エンジンが30ページを返し、そのうち20ページだけが関連していて、40ページの追加の関連ページを返さなかった場合、精度は20/30 = 2/3で、リコールは20/60 = 1/3です。
したがって、この場合、精度は「検索結果の有用性」であり、再現率は「結果の完全性」です。
MLの適合率は、情報検索の場合と同じです。
recall = TP / (TP + FN)
precision = TP / (TP + FP)
(TP = True Positive、TN = True Negative、FP = False Positive、FN = False Negative)。
これらの表記を二項分類子に使用することは理にかなっています。通常、「正」はあまり一般的ではない分類です。適合率/再現率の指標は、実際には特定の形式であり、より一般的な 混同行列 の場合は#classes = 2であることに注意してください。
また、「精度」の表記は実際にはaccuracyであり、(TP+TN)/ ALL
非常に単純な言葉で:たとえば、政治家を示す一連の写真で、政治家XYの写真が他の政治家ではなくA.メルケルを示していると正しく認識されたのは何回ですか。
精度は、他の人が認識された回数の比率です(誤検知):(正しいヒット)/(正しいヒット)+(誤検知)
リコールは、写真に写っている人の名前が誤って認識された回数の比率です(「リコール」):(正しい呼び出し)/(正しい呼び出し)+(誤った呼び出し)
これらの用語は、実際には信号検出理論に由来しています。詳細については、 http://en.wikipedia.org/wiki/Receiver_operating_characteristic を参照してください。
右側の「混同行列からの用語と派生」の下。