web-dev-qa-db-ja.com

アンチウイルスの再現と正確さではなく正確さ

大学でアンチウイルスがどのように機能するかを研究しています。これはほんの基本です。

彼は私たちがより良いと思うことを私たちの意見で尋ねました:リコールまたは精度.

なぜ私の教授はrecallprecisionを気にしていてaccuracyは気にしないと言うのですか?

私たちは偽陽性と偽陰性について話していたので、これは何らかの形でこれに関連しています。

ありがとうございました。

編集:明確にするために、教授は正確さについては気にしないと言った後、理由を尋ねました。

2
John Smith

これは、マルウェア検出における重大なクラスの不均衡の問題が原因です。人間が「マルウェア」と呼ぶ対象クラスのインスタンスは、「マルウェアではない」インスタンスよりもはるかに数が多い。すべてのプログラムのセットのうち、1%はマルウェアであり、99%はそうではないとします。自明な分類子は、分析するすべてのプログラムを多数派クラス(「マルウェアではない」クラス)に割り当てるだけで、99%の精度を達成できます。明らかに、このアプローチは、マルウェアと非マルウェアを区別する目的にはあまり適していません。したがって、深刻なクラスの不均衡を伴う分類の問題では、特にマルウェアの場合のように、少数クラスが関心のあるクラスである場合に、単純な精度に加えて、モデルのパフォーマンスを評価するために使用できる代替メトリックがあります。精度と再現率は、このような代替指標の例です。

1
julian