Apache Cassandra シャーディングをサポートしていますか?
この質問は些細なことのように思われるに違いありませんが、答えが見つからないようです。 Cassandraは、大規模にシャーディングするGAEのBig Tableを部分的にモデル化したものだと読みました。しかし、現在私が見つけているドキュメントのほとんどはCassandra Cassandraは複数のマシン間でデータを水平方向に分割するのではなく、多くの重複するマシンをサポートすることを意味します。これは、Cassandraが高可用性に適していることを意味します。読み取りますが、書き込みボリュームが非常に大きくなると、最終的には機能しなくなります。
Cassandraはノード間でパーティションを作成します(分割できない場合はスケーリングできないため)。 Cassandraクラスターのすべてのデータは「リング」に分割され、リング上の各ノードは1つ以上のキー範囲を担当します。パーティショナーを制御できます(例:ランダム、 Ordered)と、要件に基づいてキー/列を複製する必要があるリング上のノードの数。
これにはかなり良い概要が含まれています。 基本アーキテクチャ
また、Dynamoのホワイトペーパーを読むことを強くお勧めします。 CassandraはDynamoとは多くの点で異なりますが、概念的には同じルーツに由来します。チェックしてください: Dynamoホワイトペーパー