簡単にするために私の質問のためにいくつかの混乱:
"大規模なクラウドプロバイダーはどのような種類のストレージを使用し、その理由は?"
私が理解している限りでは、一般的なデータセンターとクラウドの間に公式のストレージネットワークの違いを見つけることはできません。すべてのクラウドプロバイダーは、一般的なデータセンターとは異なるDASを使用しています。
DASにもSANまたはNASよりも多くの欠点がありますが、クラウドがストレージまたはアプリケーションの目的でDASを使用する理由の詳細を知りたいと思います。
明確にするために、リソースや説明をいただければ幸いです。
編集:「大規模クラウド構築のためのネットワーキングの課題と結果として生じるアプローチ、DavidBernsteinとErikLudvigson(Cisco)」という論文を読んでいる間、彼らは次のように述べています。
不思議なことに、NASまたはSANを使用している主要プロバイダーからのクラウドは見られません。一般的なクラウドアーキテクチャはDASを使用しますが、これはデータセンターストレージアプローチでは一般的ではありません。
しかし、ここには矛盾があります。私の意見では、またこのペーパーの後半で述べているように、クラウドはSANまたはNASを使用する必要があります。これは、DASが適切でない場合、 VMは別のサーバーに移動しますが、元のサーバーからストレージにアクセスする必要があります。
クラウドがDAS、NASまたはSAN)を好む他の理由は何ですか?大規模なクラウドプロバイダーはどのような種類のストレージを使用し、その理由は何ですか?
この回答は、質問が明確になった後に編集されました。
雲がDASを好む他の理由は何ですか
ここで、「DAS」は直接接続ストレージ、つまりSATAまたはSASハードディスクドライブを意味します。
クラウドベンダーはすべてDASを使用しています。これは、DASが価格/パフォーマンスを大幅に向上させるためです。 水平方向にスケーリング の場合です。
要するに、SATAハードディスクドライブとSATAコントローラーは安価な商品です。それらはマスマーケット製品であり、非常に低価格です。安価なSATAドライブを備えた安価なPCの大規模なクラスターを構築することにより、Google、Amazonなどは非常に低価格で膨大な容量を獲得します。次に、独自のソフトウェアレイヤーを上に追加します。彼らのソフトウェアは、パフォーマンスと信頼性、監視、ハードウェア障害後のレプリケーションのリバランスなどのためにマルチサーバーレプリケーションを実行します。
MogileFS は、Google、Amazonなどがストレージに使用するソフトウェアの種類をより簡単に表すものとして見ることができます。もちろんこれは別の実装ですが、大規模システムと同じ設計目標とソリューションの多くを共有しています。必要に応じて、ここに GoogleFS についてさらに学ぶためのジャンプポイントがあります。
後で説明するように、クラウドはSANまたはNASを使用する必要があります。これは、a VMがに移動する場合、DASは適切ではないためです。別のサーバー
SANが使用されない理由は2つあります。
1)価格。SANは大規模で非常に高価です。これらは技術的に「最良の」ソリューションである可能性がありますが、コストがかかるため、通常、非常に大規模なインストールでは使用されません。
2)CAP定理Eric BrewerのCAP定理 は、非常に大規模な場合、許容可能な信頼性を維持しながら強力な一貫性を維持できないことを示しています。フォールトトレランス、およびパフォーマンス。 SANは、ハードウェアに強い一貫性を持たせるための試みです。これは、5.000サーバーのインストールではうまく機能する可能性がありますが、Googleの250.000以上のサーバーで機能することが証明されたことはありません。
結果:これまでのところ、クラウドコンピューティングベンダーは、サーバー状態の維持の複雑さをアプリケーション開発者にプッシュすることを選択しました。現在のクラウド製品は、各仮想マシンに一貫した状態を提供していません。アプリケーションサーバー(仮想マシン)がクラッシュし、ローカルデータがいつでも失われる可能性があります。
各ベンダーは、重要なデータに使用することになっている永続ストレージの独自の実装を持っています。アマゾンの製品は良い例です。 MySQL 、 SimpleDB 、および Simple Storage Service 。これらのオファリング自体はCAP定理を反映しています。MySQLインスタンスの一貫性は強力ですが、スケーラビリティは制限されています。 SimpleDBとS3は素晴らしく拡張できますが、結果整合性があります。
yo DASを使用する場合、可用性が問題になります
they DASを使用する場合、可用性が問題になります。そして、もしそれらが何か良いものであれば、彼らは彼らの問題があなたの問題にならないことを確実にするために抽象化のいくつかの層を使用するでしょう。問題は、データセンター内にディスクをマウントする方法にとらわれるのではなく、SLAで保証されている可用性がニーズに適しているかどうかです。ああ、本当のことです。部屋の中の象、彼らが廃業した場合はどうしますか(一部のプロバイダーではおそらくそうではありませんが、それでも検討する必要があります)、このデータをローカルで使用し、Web間接続が利用できない場合はどうしますか?後者の場合DASを選択するよりも、停止に直接つながる可能性が大幅に高くなります。
(意見のみで、非常に一般化されています。)
違いは、(一般的に)見ている抽象化レイヤーです。
SAN/NASは通常、ファイルシステムをインストールできるボリュームを提供します。エンドシステムに対するこのアプローチの価値は、物理ハードウェアの詳細(RAIDレベル、物理的な場所など)を外部委託していることです。
対照的に、クラウドストレージは通常、ファイルシステムへのインターフェイスを提供します。ここでの利点は、高次の機能を無料で入手できることです(たとえば、Dropboxはすべてのファイルの自動バージョン管理を透過的に行います)。
DASとSAN/NASについては答えを持っていませんが、ストレージソリューションを探す際に考慮すべきことがたくさんあります。
データの量は? Gbについては、問題ありません。バックアップを使用したa NASで十分です。テラバイトのデータがある場合、価格は非常に速く上昇します。
価格が主な要因だと思います... SANをお持ちの場合は、次のものが必要です。
それでも、冗長性はまったくありません。データセンターにアクセスできる場合は、状況が異なる場合があります。
考慮すべきもう1つのことは、アクセシビリティです。アーカイブしていますか?そのようにアクセス可能性が問題にならない場合は、1日/週/月に数回ストレージソリューションにアーカイブします。
一方、常にアクセスする必要のあるデータがある場合は、帯域幅のボトルネック、ハードウェアの制限(I/Oなど)をすぐに見つけることができます。ただし、一方で、データを大量に転送する場合は、オンラインストレージソリューションに多額の費用がかかる可能性があります。
ROI(投資収益率)は、すべてのオンラインストレージソリューションベンダーが宣伝しているものであり、もちろん、使用法にもよりますが、多くの場合正しいものです。
幸運を。