web-dev-qa-db-ja.com

World Wide Webの最大のサイトはどのデータベースで動作しますか?

この質問は、主要なWebサイトが使用するデータベースとその構成のリストとして機能することを意図しており、WebサイトをTwitter、Facebook、またはGoogleのサイズに拡大することを考えている人にとっては非常に参考になります。

回答を最小限に抑え、使用されている情報源を必ず引用してください。

編集:

また、スキャンを容易にするために、Webサイト名とデータベースの両方をboldにしてください。

65
niktech

Facebook.com

  • MyRocksを使用したMySQL。ユーザー情報と、いいね、コメント、共有などのソーシャルアクティビティを保存するために使用されます。
  • Hive(Hadoopのデータウェアハウスは、テーブルと、hiveQLと呼ばれるSQLのバリアントをサポートしています)。 「単純な要約ジョブ、ビジネスインテリジェンス、機械学習、その他多くのアプリケーション」に使用
  • Cassandra(多次元、分散キー値ストア)。現在、Facebookのプライベートメッセージングに使用されています。

現在、Hiveデータストアを持つ単一クラスターで610(まもなく1000になる)Hadoopノードを実行しています。 HiveとCassandraはFacebookによってオープンソース化されています。

Facebookの統計:

  • 2億人以上のアクティブユーザー
  • 1日1回以上1億人以上のユーザーがFacebookにログオンしている
  • 3000万人以上のユーザーが少なくとも1日に1回はステータスを更新します
  • 平均的なユーザーのサイトには120人の友人がいます

ソース:

26
niktech

スタックオーバーフロー -SQL Server。

ジェフ・アトウッドはこれについてニースのブログ記事を書きました

https://blog.stackoverflow.com/2008/09/what-was-stack-overflow-built-with/

16
ACP

LinkedIn.com

  • Oracle(リレーショナルデータベース)
  • MySQL(リレーショナルデータベース)

高可用性のために複数のサーバーに複製されたデータベース。特定の各サービスは、独自のドメイン固有のDBを使用します。

LinkedInの統計:

  • 2,200万人のメンバー
  • 月間400万人以上のユニークビジター
  • 1日あたり4,000万ページビュー
  • 1日あたり200万件の検索

ソース:

15
niktech

FlickrMySQLを使用します。

YouTubeMySQLを使用しますが、GoogleのBigTableに移行しています。

MyspaceSQL Serverを使用します。

WikipediaMySQLを使用します。

13
Mohammed Nasman

Microsoft.com

  • SQL Server(そこに驚きはありません)

Microsoft.comの統計:

  • 1か月あたり2億5,000万のユニークアクセス。
  • 1日あたり7000万ページビュー。
  • 15,000接続/秒。
  • 合計80のWebサーバーへの平均35,000の同時接続を維持します。

ソース:

12
Fredrik Mörk

Yahoo.com

  • PostgreSQL(変更)-クライアントはクラスター(またはポリシー制限サブセット)のノードのいずれかに接続できます。クエリは、クライアントから接続先として選択したサーバーに流れます。そのノードのSQLコンパイラーは、その単一ノードでクエリをコンパイルおよび最適化します(並列処理なし)。

Yahoo.comの統計:

  • 1日240億のイベント
  • 2ペタバイト、最大のデータベースを主張(2008年3月)

ソース:

11
KahWee Teng

Twitter.com

  • MySQL(リレーショナルデータベース)。
  • Cassandra(多次元分散Key-Valueストア)。 Twitterは、「Cassandra at Twitter)」の使用を開始しました(2番目のソースを参照)。

2008年5月、Twitterには書き込み用に1つのMySQLインスタンスがあり、読み取り用に複数のMySQLスレーブインスタンスがありました。

Twitterの統計:

  • 総ユーザー数:100万人以上
  • アクティブユーザーの合計:週200,000
  • 総Twitterメッセージ:300万/日
  • Twitterユーザーの5%が全アクティビティの75%を占めています
  • 2009年の最初の5か月間に参加した全ユーザーの72.5%

ソース:

9
niktech

Digg

  • MySQL(リレーショナルデータベース)読み取りのスケールアウト用
  • MemcacheDB(Key-Value Store)書き込みのスケールアウト用

両方のデータストアは複数のサーバーに分散されます。

Diggの統計:

  • 3,000万人のユーザー
  • 1か月あたり2,600万のユニーク
  • 月に20億のリクエスト
  • 毎秒13,000リクエスト、毎秒27,000リクエストのピーク。

ソース:

8
niktech

GoogleBigTableを使用します: http:// research。 google.com/archive/bigtable.html

5
stribika
3
duffymo