web-dev-qa-db-ja.com

scikit-learnsvmlightフォーマットローダーの非推奨警告

私が書いたIPythonノートブックで、これまでに見たことのない新しい非推奨の警告が表示されます。私が見ているのは次のとおりです。

X,y = load_svmlight_file('./GasSensorArray/batch2.dat')
/Users/cpd/.virtualenvs/py27-ipython+pandas/lib/python2.7/site-packages/sklearn/datasets/svmlight_format.py:137: DeprecationWarning: using a non-integer number instead of an integer will result in an error in the future
return _load_svmlight_file(f, dtype, multilabel, zero_based, query_id)
/Users/cpd/.virtualenvs/py27-ipython+pandas/lib/python2.7/site-packages/sklearn/datasets/svmlight_format.py:137: DeprecationWarning: using a non-integer number instead of an integer will result in an error in the future
return _load_svmlight_file(f, dtype, multilabel, zero_based, query_id)
...

ここで何が問題になるのかについて何か考えはありますか?データファイルをもう一度見てみましたが、一見したところ明らかな問題は見当たりません。これを引き起こしたであろうシステム設定で何を変更したのかわかりません。 scikit-learnのv。0.14.1がインストールされています。

14
Chris

これはnumpy1.8.0の非推奨警告であるため、おそらくnumpyバージョンをアップグレードしました。 this プルリクエストで説明されています。 this PRの続き。

Sklearnを簡単に閲覧 課題追跡システム 、関連する問題は見つかりませんでした。見つからない場合は、より適切に検索してバグレポートを提出することができます。

12
alko

Numpyをアップグレードした後、整数以外の数値を使用して配列にインデックスを付けようとすると、この非推奨の警告が表示されます。 sklearnでは、計算時にインデックスがすべて整数値であるにもかかわらず、データ型が浮動小数点数である場所がたくさんあります。

したがって、numpyで配列にインデックスを付けるときは常に、インデックスが整数型であることを確認する必要があります。しかし、これはsklearnの多くの場所では当てはまりません。修正は簡単な場合もありますが(たとえば、除算を使用してインデックスを計算する場合は、//の代わりに/を使用します)、そうでない場合もありますが、今のところ、心配する必要はありません。単なる警告です。

6
adrin