web-dev-qa-db-ja.com

エンタープライズストレージシステム上のZFS

EMC、NetAppなどのシステムのようなエンタープライズストレージには、データが失われないことを保証するための独自のアルゴリズムと方法があります。このようなストレージシステムに多数のサーバーを接続するシナリオでは、ZFSをファイルシステムとして使用した場合にメリットはありますか?ストレージ自体の機能は、実行可能な最高のデータ整合性、圧縮、重複排除などを提供し、すべての努力を冗長にしませんか?したがって、この場合、XFS、UFS、またはその他のファイルシステムは好ましくありませんか?

3
gmelis

Andrew Henleが言ったように、このブラックボックスストレージシステムがあなたが望むことをするという保証は基本的にありません。もちろん、ZFSを内部で使用している場合でも、必要なすべてのことをすでに実行している可能性がありますが、確かなことはわかりません。そして、あなたが正確に知っているとしても、あなたはおそらくそれをあなたの好みに完全に構​​成することはできません。

したがって、基本的に3つの異なる状況が考えられます。

  1. システムについて何も知らず、意味のある方法でシステムを構成することはできません。この場合、ほとんどのクラウドストレージが該当します。大企業のストレージシステムでは、プロジェクトで必要な場合にリクエストすることで、特定のサイズの「ストレージ」を取得できます。
  2. システムがどのように機能し、構成されているかは知っていますが、自分で構成することはできません。
  3. あなたはそれがどのように機能するかを知っており、それを積極的に変更することができます(付与された特権を介して、または管理者にそれを行うように指示することによって)。ほとんどの場合、お互いを知っている、またはさまざまなニーズを満たす必要があることを人々が知っている小規模なオペレーションで発生します。

これは、「ZFSを上に置くことは有益なのか、それとも無駄なのか、それとも問題があるのか​​」という質問に対する次の回答につながります。

  1. 保証がないため、パフォーマンスの唯一の欠点でほぼすべての機能を利用できます。システムがどのように機能するかを調べるために、ベンチマークとテストを何度も行う必要があるかもしれませんが、十分なパフォーマンスが得られない可能性があります。もちろん、それはすべて無駄かもしれませんが、あなたが知らないように、あなたは安全な側にとどまります。
  2. 1と同様ですが、それがどのように機能するかがわかったので、パフォーマンスを最適化することができます。最悪の場合、パフォーマンスが悪い理由を知ることができます。また、すでに持っている機能を知っているので、ZFS機能があなたのケースでそれだけの価値があるかどうかをより多くの情報に基づいて決定することができます。
  3. 2と同様ですが、ストレージシステムをアクティブに構成および最適化できるようになったため、ZFSを必要としない可能性がさらに高くなります。また、そうする場合でも、両方を調整してパフォーマンスの低下を最小限に抑えることができます。
1
user121391

CERNの調査によると、非常に高価なストレージシステムでさえビット腐敗に悩まされています。さらに、彼らの調査によると、ZFSはビット腐敗に悩まされていません。また、独立した計算機科学の研究者は、ZFSがビット腐敗に悩まされていないことも示しています。これがCERNがZFSに切り替えた理由です。また、IBM Sequoiaスーパーコンピューターは、Lustreを使用して55 Petabyteデータを格納します。Lustreは、ディスク上の実際のストレージにZFSを使用する並列ストレージシステムです。GoogleCERNとZFSを使用すると、多くのデータが表示されます。データの整合性に関する研究論文。また、ZFSに関するwikipediaの記事には、データの整合性に関する研究論文があります。

0
ZFS master