web-dev-qa-db-ja.com

クラスターのセットアップ

スイッチを介してLAN経由で5台のPCを接続しています。
それらを接続してHPCクラスターを形成したいと思います。 OSはどのLinuxバージョンでもかまいません(現在、Ubuntu 8.10、9.10、Fedora 10をインストールしています)
クラスターの目的
1。 OpenMPを使用して開発されたCコードを実行し、高性能を提供するため。
2。私が開発したJSP動的Webドキュメントの負荷分散クラスターとして機能するため。

私は両方の目的を解決する1つのクラスターを開発したいと思いますが、最悪の場合、私のクラスターが少なくとも最初の目的を容易にすることを期待します。

また、1つのノードのボトルネックがなく、障害が発生した場合にシステム全体の障害を意味するクラスターを開発したいと思います。代わりに、少数の(最も重要な)ノードで障害が発生した場合でも、クラスターが残りのノードで動作し続けるようにします...

どんな種類の助けもありがたいです。

よろしくお願いします

2
Vaibhav

OpenMPでやりたいことができるとは思いません。 OpenMPは、共有メモリプログラミング用に設計されています。この一例は、同じマシンで複数のコアやプロセッサを使用することです。クラスター(少なくともコモディティハードウェアから作成された一般的なクラスター)は分散メモリです。通常、MPIは、これらのタイプのマシンをプログラムするために使用されます。

分散メモリクラスターを管理するためのソリューションはいくつかあります。私がよく知っているのは xcatwarewulf です。通常、これらのタイプのシステムには、空きノードでジョブを実行するジョブキューがあります。ノードに障害が発生した場合、そのノードを使用しているジョブはおそらく失敗しますが、ジョブは残りのノードで引き続きスケジュールされます。

2
KeithB

GridEngine(任意のバリアント)を見てみましょう。 Ubuntuへのインストールは簡単で、同じリソースを利用してさまざまなアプリケーションを実行するための優れたサポートがあります。さまざまなタイプのアプリケーションにさまざまなキューを指定したり、下位のキューを指定したりして、優先度の高いタスクが優先度の低いタスクをノードから追い出すことができます。

状況によっては、ロードバランサータスクをジョブとしてスケジューラーに送信し、必要に応じてHPCタスクによってある程度プリエンプトされる可能性があります。

ノード障害に対する回復力に関しては、それは確かにカバーされています。通常、複数のノードにまたがるタスクがない限り、単一の実行ノードの障害がクラスターの残りの部分に影響を与えることはありません。

1
Kamil Kisiel

単純なアプリケーションを実行したいだけで、クラスターを24時間年中無休で実行したくない場合は、PelicanHPCを使用してインスタントHPCを作成する必要があります。 Pareto.uab.es/mcreel/PelicanHPCマスターノードからPelicanHPCを起動し、別のコンピューターのネットワークを起動するだけです。チュートリアル: http://Pareto.uab.es/mcreel/PelicanHPC/Tutorial/PelicanTutorial.html

1
alejo0317

たぶん、あなたは Rocks Clusters 、あなたの最初のポイントのニーズに合うディストリビューションデザインで行くことができます。これは主に科学環境で使用され、複数のノード(PXE)間で比較的簡単にセットアップできます。また、いくつかのMPI実装(OpenMPI、mpich、...)やSun GridEngineなどのパッケージ済みソフトウェアも含まれています。ディストリビューション全体はCentOS/RHELに基づいているため、既に精通している場合はFedoraは、インストール中に問題が発生することはありません。

0
Fladi

かなり良いキューイングシステムで「Beowulf」をセットアップする

0
Jayan