web-dev-qa-db-ja.com

トルクジョブでのテンソルフローコードの実行

ジョブを分散するためにトルクで実行されているクラスターがあります。テンソルフローコードでジョブを実行したいのですが、テンソルフローが認識されないという問題があります。

Anacondaを使用してLDAPユーザーにtensorflowをインストールしたので、任意のノードでtensorflow環境に入り、コードを手動で実行できます。私の問題は、トルクジョブの実行時に環境が開かないため、「ImportError:No module name tensorflow」が表示され、コードが実行されないことです。

pythonファイルをテンソルフロー環境で実行するようにノードに指示するにはどうすればよいですか?

これが私のトルクジョブファイルの外観です

注:ここでは、環境を開くコマンドを実行しようとしましたが、他のバージョンでは実行しませんでした。

利用可能なヘルプを事前に感謝します。

1
Oha Noch

申し訳ありませんが、答えを受け取ったときに返信するのを忘れました。将来誰かがこれを見た場合、私の問題の修正は、PATH変数をanaconda binフォルダー(python = anacondaが使用し、tensorflowにアクセスできるバイナリ):

export PATH="<path_to_anaconda_folder>/anaconda3/bin:$PATH"

助けてくれたTux_DEV_NULLに感謝します!

また、将来のcudaの問題(私はgpuを使用しています)を避けるために、以下を追加しました。実際に必要かどうかはわかりませんが、誰かを助けることになります。

export PATH=$PATH:/usr/local/cuda-8.0/bin
1
Oha Noch