ユーザーが大量のユーザーデータをクエリできるウェブサイトをどのように設計しますか。具体的には次のとおりです。
私はこの要件にどのように取り組むかに関する思考プロセスにもっと興味があります。例えば:
私は周りを検索して、キャッシュ、負荷分散などについて話している多くの人々を見てきました...もちろん、これらの手法は便利で使用できますが、Nユーザーの処理に役立つことをどのように知っていますか?この点について誰も説明していないようです。
それはかなり基本的な数学です。
ボトルネックはデータベースではありそうにありませんが、帯域幅です。
最大帯域幅を取り、予想されるユーザー数で割り、オーバーヘッドの15%を差し引きます。
本当に無制限の帯域幅がある場合は、データベースのスループットを使用して同じ計算を行ってください。
現時点でクラウド技術では、データの読み込みを処理するために他の人がすでに設計したものを採用します。あなたは少しのデータを持っていますが、私はこれらのデータと将来の記録を次のようなものに入れます GoogleのBigQuery :
設計上、キャッシュされていないクエリの慣性時間がありますが、上記のすべてを設計、スケーリング、スクリプト化、支払い、および維持しようとすると、すぐに逃げてしまいます。