ジョブを分散するためにトルクで実行されているクラスターがあります。テンソルフローコードでジョブを実行したいのですが、テンソルフローが認識されないという問題があります。
Anacondaを使用してLDAPユーザーにtensorflowをインストールしたので、任意のノードでtensorflow環境に入り、コードを手動で実行できます。私の問題は、トルクジョブの実行時に環境が開かないため、「ImportError:No module name tensorflow」が表示され、コードが実行されないことです。
pythonファイルをテンソルフロー環境で実行するようにノードに指示するにはどうすればよいですか?
注:ここでは、環境を開くコマンドを実行しようとしましたが、他のバージョンでは実行しませんでした。
利用可能なヘルプを事前に感謝します。
申し訳ありませんが、答えを受け取ったときに返信するのを忘れました。将来誰かがこれを見た場合、私の問題の修正は、PATH変数をanaconda binフォルダー(python = anacondaが使用し、tensorflowにアクセスできるバイナリ):
export PATH="<path_to_anaconda_folder>/anaconda3/bin:$PATH"
助けてくれたTux_DEV_NULLに感謝します!
また、将来のcudaの問題(私はgpuを使用しています)を避けるために、以下を追加しました。実際に必要かどうかはわかりませんが、誰かを助けることになります。
export PATH=$PATH:/usr/local/cuda-8.0/bin