web-dev-qa-db-ja.com

Pythonの機械学習に推奨されるパッケージはありますか?

Pythonの機械学習に推奨されるパッケージはありますか?

私は、C++および [〜#〜] matlab [〜#〜] でさまざまな機械学習と統計アルゴリズムを実装した経験がありますが、Python Iでいくつかの作業を行いました。 Pythonで利用可能なパッケージに興味があります。

86
Ori Folger

scikit-learn もあります(BSD、numpyとscipyへの依存関係のみ)。次のようなさまざまな教師あり学習アルゴリズムが含まれています。

  • Libsvmに基づくSVMと、ワイドフィーチャデータセットのscipy.sparseバインディングを使用した線形
  • ベイジアン法
  • HMM
  • L1およびL1 + L2正規化回帰法(別名LassoおよびElastic Netモデル)は、LARSや座標降下などのアルゴリズムで実装されます

また、次のような教師なしクラスタリングアルゴリズムも備えています。

  • kmeans ++
  • 平均シフト
  • アフィニティ伝播
  • スペクトルクラスタリング

また、次のような他のツールも:

  • テキストコンテンツの機能抽出(トークンと文字グラム+ハッシュベクトライザー)
  • 単変量特徴選択
  • シンプルなパイプラインツール
  • 相互検証戦略の多数の実装
  • パフォーマンスメトリックの評価とプロット(ROC曲線、AUC、混同マトリックス、...)
  • 並列クロス検証を使用してハイパーパラメーター調整を実行するグ​​リッド検索ユーティリティ
  • 対話型環境で作業するときに部分的な結果をキャッシュするためのjoblibとの統合(例:ipythonを使用)

各アルゴリズムの実装には、おもちゃデータまたは実際のデータセットでの使用法を示す サンプルプログラム が付属しています。

また、公式のソースリポジトリは githubでホスト ですので、インタラクティブなコードレビューのために通常のプルリクエスト機能を使用して、バグ修正と改善に貢献してください。

103
ogrisel

一般的なユーザーフレンドリーなパッケージは Orange -WekaやRapidMinerのようなものです。

それ以外にも、さまざまなタスク用のさまざまなパッケージとツールキットがあります。出発点としてPython mloss にリストされているパッケージを参照する必要があります。

12
ars

あなたが見てみたいことがあります:

http://www.shogun-toolbox.org/ 。これには、Pythonを含む複数の言語のインターフェースがあります。 http://www.pybrain.org/ もあります。これはMLアルゴリズムのネイティブ実装です(私は信じています)。お役に立てば幸いです。

8
oort

Deep Learning Tutorials ディープニューラルネットワークの開発とトレーニングの方法を説明します。 使用済みライブラリ Nvidia GPUを使用する場合でも使用します。

6
Ivo Danihelka

サポートベクターマシンについては、 LibSVM をご覧ください。これは、とりわけ、Pythonインターフェイスです。

6
Piotr Byzia
5
sastanin

http://www.pymvpa.org も機能する可能性があります。

4
Mike

この機械学習を正確に呼び出すかどうかはわかりませんが、 nltk package はテキストのベイジアンスタイルの分類を行います。学習データとテストデータを使用して、データに関するルールを推測していることを確認できます。

3
hughdbrown

これはSciPyが行ったすばらしいリストです。多くの有名なPythonパッケージ、とりわけ機械学習関連: 人工知能と機械学習

3
Piotr Byzia

SVMlight は、 LibSVM の代わりに便利な場合があります! LibSVMも素晴らしいです。

1
Kyle.

データ処理(MDP)のモジュラーツールキット をご覧ください。機械学習と統計からいくつかのアルゴリズムを実装し、成熟しており、十分に文書化されています。

1
nikow