web-dev-qa-db-ja.com

マルチクラスSVM(1対すべて)

マルチクラスSVMに関しては、LIBSVMでは1対1の分類しか許可されていないことを私は知っています。ただし、すべてに対して1つの分類を実行するために少し調整したいと思います。私は以下のすべてに対して1つを実行しようとしました。これは正しいアプローチですか?

コード:

TrainLabel;TrainVec;TestVec;TestLaBel;
u=unique(TrainLabel);
N=length(u);
if(N>2)
    itr=1;
    classes=0;
    while((classes~=1)&&(itr<=length(u)))
        c1=(TrainLabel==u(itr));
        newClass=c1;
        model = svmtrain(TrainLabel, TrainVec, '-c 1 -g 0.00154'); 
        [predict_label, accuracy, dec_values] = svmpredict(TestLabel, TestVec, model);
        itr=itr+1;
    end
itr=itr-1;
end

私はいくつかの間違いをしたかもしれません。フィードバックをお願いします。ありがとう。

第二部:グレーポットが言ったように:私は最終的な答えを思い付くために合計プーリング(または単純化された解決策としての投票)を行う必要があります。どうすればいいのかわかりません。助けが必要です。 pythonファイルを見ましたが、それでもよくわかりません。助けが必要です。

11
lakesh
%# Fisher Iris dataset
load fisheriris
[~,~,labels] = unique(species);   %# labels: 1/2/3
data = zscore(meas);              %# scale features
numInst = size(data,1);
numLabels = max(labels);

%# split training/testing
idx = randperm(numInst);
numTrain = 100; numTest = numInst - numTrain;
trainData = data(idx(1:numTrain),:);  testData = data(idx(numTrain+1:end),:);
trainLabel = labels(idx(1:numTrain)); testLabel = labels(idx(numTrain+1:end));
%# train one-against-all models
model = cell(numLabels,1);
for k=1:numLabels
    model{k} = svmtrain(double(trainLabel==k), trainData, '-c 1 -g 0.2 -b 1');
end

%# get probability estimates of test instances using each model
prob = zeros(numTest,numLabels);
for k=1:numLabels
    [~,~,p] = svmpredict(double(testLabel==k), testData, model{k}, '-b 1');
    prob(:,k) = p(:,model{k}.Label==1);    %# probability of class==k
end

%# predict the class with the highest probability
[~,pred] = max(prob,[],2);
acc = sum(pred == testLabel) ./ numel(testLabel)    %# accuracy
C = confusionmat(testLabel, pred)                   %# confusion matrix
10
lakesh

コードから、最初にラベルを「あるクラス」と「このクラスではない」に変換し、次にLibSVMを呼び出してトレーニングとテストを実行しようとしていることがわかります。いくつかの質問と提案:

  1. 元のTrainingLabelをトレーニングに使用しているのはなぜですか?私の意見では、それはmodel = svmtrain(newClass, TrainVec, '-c 1 -g 0.00154');である必要がありますか?
  2. トレーニングメカニズムを変更すると、合計プーリングを使用して最終的なラベルを決定するなど、予測部分を微調整する必要もあります。 LibSVMで-bスイッチを使用して確率出力を有効にすると、精度も向上します。
4
grapeot

確率推定の代わりに、次のように決定値を使用することもできます。

[~,~,d] = svmpredict(double(testLabel==k), testData, model{k});
prob(:,k) = d * (2 * model{i}.Label(1) - 1);

同じ目的を達成するために。

1
Venkata