web-dev-qa-db-ja.com

マルチクラスモデルの精度、精度、再現率

精度精度recallナイーブベイズモデルの各クラスに対して?埋め込みデータセットを使用しています:アイリスとパッケージtreeおよびパッケージe1071 Naive Bayesの場合。混同行列は次のとおりです。

prediction   setosa versicolor virginica
setosa         29          0         0
versicolor      0         20         2
virginica       0          3        21

PS:私が75のエントリをテスト用のトレーニングセットおよびその他として使用していることに注意してください:

iris.train <- c(sample(1:150, 75)) # have selected 75 randomly
15
jack

この回答全体を通して、matはあなたが説明する混同行列です。

次の方法で精度を計算して保存できます。

(accuracy <- sum(diag(mat)) / sum(mat))
# [1] 0.9333333

各クラスの精度(予測が行にあり、真の結果が列にあると仮定)は、次のように計算できます。

(precision <- diag(mat) / rowSums(mat))
#     setosa versicolor  virginica 
#  1.0000000  0.9090909  0.8750000 

特定のクラスの精度を取得したい場合は、次のようにします。

(precision.versicolor <- precision["versicolor"])
# versicolor 
#  0.9090909 

各クラスのリコール(ここでも、予測が行にあり、真の結果が列にあると仮定)は、次のように計算できます。

recall <- (diag(mat) / colSums(mat))
#     setosa versicolor  virginica 
#  1.0000000  0.8695652  0.9130435 

特定のクラスのリコールが必要な場合は、次のようにすることができます。

(recall.virginica <- recall["virginica"])
# virginica 
# 0.9130435 

代わりに、行として真の結果があり、列として予測結果がある場合は、精度を反転させて定義を再現します。

データ:

(mat = as.matrix(read.table(text="  setosa versicolor virginica
 setosa         29          0         0
 versicolor      0         20         2
 virginica       0          3        21", header=T)))
#            setosa versicolor virginica
# setosa         29          0         0
# versicolor      0         20         2
# virginica       0          3        21
23
josliber