「グーグル」といくつかの研究を行っている間、私は見つけることができませんでしたany科学的GPGPU-ComputingおよびOpenCL[〜#〜] amd [〜#〜]ハードウェア。見逃した文献やソフトウェアはありますか?
特に、私はディープラーニングに興味があります。
私が知っているすべてのdeeplearning.netは[〜#〜] nvidia [〜#〜]ハードウェアおよび[〜#〜] cuda [〜#〜]フレームワーク。さらに、Caffe、Theanoなど、私が知っているすべての大きなディープラーニングフレームワーク、トーチ、DL4J、...に焦点が当てられています[〜#〜] cuda [〜#〜]、サポートする予定はありませんOpenCL/AMD。
さらに、[〜#〜] cuda [〜#〜]ベースのディープラーニングタスクに対応する文献だけでなく、多くの科学論文を見つけることができますが、ほとんど何もありませんOpenCL/AMDベースのソリューション。
2015/16にOpenCL/AMDベースのソリューションに新しいまたは既存の科学的フレームワークが現れる可能性はありますか?
ディープラーニングとOpenCL/AMDの良い出発点は何ですか?文献はありますか?チュートリアル?その他のソース?
Edit 1Mikael Rousson's answerを参照してください-計算能力を「借りる」ことができるので、Amazonは今前進しています。
Edit 2theano
。パーソナルマシンで実行するよりもロットが便利です。
Edit 3TensorFlowはtheano
よりもはるかに広く受け入れられるようになったので、それに応じてガイドを更新しました。
Intel Irisグラフィックスを搭載したMacBook Proを所有しているのと同じ状況です。私は1週間の最善の部分をすべての可能な回避策に目を通しており、私が提供するものに代わるものを歓迎しています。
私が現在持っている最良の解決策は:
python
ライブラリをインストールします tensorflow
そこにあるGPUサポートを利用し、最新の開発バージョンへの更新を続けます。theano
を使用し、 既存のGPUサポート をtensorflow
と同様に使用しますOpenCLを使用するソリューション、たとえば pyOpenCl 、Deep Learningのユーザーフレンドリーなインターフェイスはまだありません。つまり、高速でコーディングしてCPUで実行するよりも、別の方法でコーディングする方が時間がかかります。ただし、ディープラーニングに最適な代替OpenCLライブラリは次のとおりです。
開発中
--- 2017年8月AMD側で起こったクールな新しいことを更新---
現在、ほとんどのAMDハードウェア上で任意のライブラリを実行することが実際に可能です ここをチェック
2015年10月25日現在
aMDなどは、ディープラーニングのためのいくつかのOpenCLアクセラレーションフレームワークの開発に手を伸ばしているようです。そのため、ディープラーニングのためのOpenCLサポートが存在します:)
これは、主にディープラーニングを念頭に置いて開発されたOpenCL加速フレームワークまたはツールのリストです。今後数年間で更新されることを願っています
現在(2015年10月25日)には、研究者に非常に人気のある3つのディープラーニングフレームワークがあり、いくつかの商用製品を見てきました。
テアノ
カフェ
松明
aMDは、caffeのほぼすべての機能をサポートする完全なバージョンのcaffeを開発し、積極的に開発されているため、caffeにはかなり優れたOpenCLサポートがあります。 OpenCL Caffeという名前です。ここにリポジトリがあります
パフォーマンスについて考えている場合、そのサイト(私は自分でベンチマークを立てていません)によると、AMD R9 Furyハードウェア(トレーニング)で1秒あたり約261画像または1日あたり2250万画像を提供します。 1日に4,000万枚の画像を処理できるnvidia K40と比較します。そのため、サイトによると、6分の1のお金で半分のパフォーマンスを実現できます。ただし、コンシューマーカードを使用すると、メモリ(vram)に関する問題が発生します。
最近のトーチもまともなOpenCLをサポートしているようです。ただし、1人で管理します。トーチのすべての機能を完全にサポートしていると主張しています。ただし、パフォーマンスについてはわかりません。これがリポジトリです。積極的に維持されます。
現在、theanoフレームワーク用の適切なopenclバックエンドはないようですが、作業は進行中です。また、現在のバージョンで簡単なプログラムを実行できます。
深層学習のためのいくつかの他のopenclフレームワークもあります。それらが適切に機能するかどうかを確認するには、それらを整理するのに時間がかかります。
別の方法は、Amazon Web ServicesでGPUインスタンスを使用することです。よく使用されるディープラーニングパッケージが既にインストールされているAMIを見つけることができます。例えば:
ヒント:スポットインスタンスを使用して、より安い価格(g2.2xlargeで約10セント/時間)を取得します。
PlaidML( https://github.com/plaidml/plaidml )は、OpenCLの上で実行され、Kerasと統合される完全にオープンソースの深層学習ランタイムです。使い慣れたユーザー向けAPIを提供します。リポジトリのREADMEはより詳細なステータスを持っています。現在Linuxでのconvnet推論は十分にサポートされていますが、( http://vertex.ai )完全性とプラットフォームサポートを可能な限り迅速に拡張するために取り組んでいます。当社の継続的インテグレーションマシンには、AMDとNVIDIA GPUの品揃えが含まれており、現在はすべてLinuxですが、MacとWindowsの追加にも取り組んでいます。
Tensorflowのopencl 1.2サポートを書いています。 https://github.com/hughperkins/tensorflow-cl 現在サポートしています:
AMDによって駆動される ROCmプラットフォーム を確認してください。これは、プログラミング言語に依存しない、GPUコンピューティング向けの最初のオープンソースHPC /ハイパースケールクラスプラットフォームです。
具体的には:
深層学習については、 https://rocm.github.io/dl.html を参照してください
OpenCLについては、以下を参照してください。
便利なチュートリアルはここにあります: https://rocm.github.io/tutorials.html
ご覧ください https://01.org/intel-deep-learning-framework -Intel®Deep Learning Framework(IDLF)は、Deep Convolutional Neural Networksを加速するIntel®プラットフォーム向けの統合フレームワークを提供します。これはオープンソースなので、AMDハードウェアにも移植できます。すばらしいことは、Intel Irisグラフィックスを搭載したMacBook Proで実行できることです。