web-dev-qa-db-ja.com

libsvmでのマルチクラス分類

私は libsvm で作業しており、1対allでマルチクラスの分類を実装する必要があります。

どうすればいいですか?
libsvmバージョン2011はこれを使用しますか?


私の質問はあまり明確ではないと思います。 libsvmが自動的に1対すべてを使用しない場合は、クラスごとに1つのsvmを使用します。それ以外の場合は、svmtrain関数でこのパラメーターを定義するにはどうすればよいですか。 libsvmのREADME)を読みました。

9
images

公式libsvmによると ドキュメント (セクション7):

LIBSVMは、マルチクラス分類のための「1対1」アプローチを実装しています。 kがクラスの数である場合、k(k-1)/2分類器が作成され、それぞれが2つのクラスからデータをトレーニングします。

分類では、投票戦略を使用します。各2項分類は、すべてのデータポイントxに投票できる投票と見なされます。最終的に、ポイントは最大投票数のクラスに指定されます。

one-against-allアプローチでは、クラスの数と同じ数のバイナリ分類子を作成し、それぞれが1つのクラスを他のクラスから分離するようにトレーニングします。新しいインスタンスを予測するには、決定関数の値が最大の分類器を選択します。


前に述べたように、アイデアはk SVMモデルをトレーニングして、それぞれが1つのクラスを残りのクラスから分離することです。これらの二項分類器を取得したら、確率出力(-b 1オプション)最も高い確率でクラスを選択することにより、新しいインスタンスを予測します。

次の例を考えてみましょう。

%# Fisher Iris dataset
load fisheriris
[~,~,labels] = unique(species);   %# labels: 1/2/3
data = zscore(meas);              %# scale features
numInst = size(data,1);
numLabels = max(labels);

%# split training/testing
idx = randperm(numInst);
numTrain = 100; numTest = numInst - numTrain;
trainData = data(idx(1:numTrain),:);  testData = data(idx(numTrain+1:end),:);
trainLabel = labels(idx(1:numTrain)); testLabel = labels(idx(numTrain+1:end));

マルチクラスSVMの1対すべてのアプローチの実装は次のとおりです。

%# train one-against-all models
model = cell(numLabels,1);
for k=1:numLabels
    model{k} = svmtrain(double(trainLabel==k), trainData, '-c 1 -g 0.2 -b 1');
end

%# get probability estimates of test instances using each model
prob = zeros(numTest,numLabels);
for k=1:numLabels
    [~,~,p] = svmpredict(double(testLabel==k), testData, model{k}, '-b 1');
    prob(:,k) = p(:,model{k}.Label==1);    %# probability of class==k
end

%# predict the class with the highest probability
[~,pred] = max(prob,[],2);
acc = sum(pred == testLabel) ./ numel(testLabel)    %# accuracy
C = confusionmat(testLabel, pred)                   %# confusion matrix
33
Amro