Weka は、おそらく最も一般的な汎用機械学習ライブラリです。しかし、私の経験ではかなり遅くなる可能性があります。
私は Shark 、 Waffles 、 dlib 、 学習 、および MLC++ これらのうち、Sharkとdlibが最も有望に見えます。
これらのライブラリのパフォーマンステストに関して経験がある人はいますか?
私にとって最も重要なことは、「このツールキットには、試してみたいアルゴリズムや機能がありますか?」これらのツールキットはかなり多様な機能のセットを提供するため、最初に目的を絞り込んでください。
したがって、たとえば、さまざまな進化的最適化アルゴリズムを試してみたいという強い要望がある場合は、 Shark のようなものを使用します。
一方で、私は dlib を好んでいますが、私が書いたので、それは必ずしも大した意味ではありません:)しかし、バイナリ分類に興味があるなら、私に提案させてくださいそのための私の現在のお気に入りの方法、 svm_c_ekm_trainer 。私はこれを頻繁に使用して、数十万点のデータセットで非線形SVMをトレーニングします。通常、数分(または場合によっては数秒)で実行されますが、このための従来のSMOアルゴリズムが完了するには数時間または数日かかります。
それほど前に聞かれない同様の質問に対するいくつかの良い答えもありました: 使用する機械学習ライブラリ 。