web-dev-qa-db-ja.com

Ubuntu 12.04用の2ノードクラスターを作成する方法は?

Ubuntu 12.04デスクトップバージョンを実行している2台のPCに1ギガビットイーサネットスイッチを介して接続しています。 2ノードクラスターを作成し、2つのノードでジョブを送信およびスケジュールするようにTorqueを構成します。

ノード全体でMPIタイプのジョブを実行することに興味がないことに注意してください。私の計算は一度に1つのノードで実行されますが、ジョブが終了したときに待機して新しいジョブを手動で送信するのではなく、qsubを使用して複数のジョブを送信し、ノードが解放されるまでキューに入れたいと思います。

私の質問は2つの部分に分けられると思います

a)上記で説明したシステムに最適なクラスター設定は何ですか?

b)クラスターをセットアップした後にトルクをセットアップするにはどうすればよいですか。各マシンにすでにTorqueをインストールしていることに注意してください。

前もって感謝します

2
Jeanno

このためにトルクを設定するのはそれほど難しくないはずです、あなたは必要です:

  • torque-servertorque-scheduler、およびtorque-clientはいずれかのコンピューターにインストールされています。
  • torque-clientは2番目にインストールされます。
  • ホスト名を使用していることと、ネットワークでホスト名を簡単に解決できること(IPは使用されていないこと)を確認し、必要に応じて/etc/hostsファイルに強制的に追加します。
  • パスワードなしでアクセスするには、コンピューター間にsshキーを設定する必要があります。
  • ユーザー用の共有NFSホーム、またはコンピューター間で使用できる別のディレクトリを強くお勧めします(送信中のジョブの出力を問題なく書き込むことができる場合に適しています)。
  • /etc/torque/server_nameおよび/var/spool/torque/server_priv/nodes;を編集して、初期トルク設定をセットアップします。
  • ネットワーク内の各コンピューターと各コンピューターで使用可能なリソース(CPU、RAM)を使用して、トルクインキューでトルクキューを設定します。

それが完了した後、実際に行う必要があるのは、ジョブをキューに送信することだけであり、キューに利用可能なものがあるかどうかトルクが判断します。

注:ここでいずれかのステップで立ち往生している場合は、このサイトの検索機能を使用して、そのテーマに関するハウツーを探してください。 「トルクでXを実行する方法」に関する新しい質問。あなたの質問は非常に曖昧なので、あなたが得ることができる唯一の答えも非常に曖昧です...

3
Bruno Pereira