web-dev-qa-db-ja.com

プラットフォームとしてのGoogleリーダー、商用利用?

私は小さなニュース集約サービスを構築しています。このサービスでは、ウェブ上の約1600のソースからニュースを収集し、取得した記事を分析します。 (rssフィードのみを取得します。)この点で、 プラットフォームとしてのGoogleリーダー を使用します。つまり、私のアプリケーションは単一のソース(Google Readerアカウント)からすべてのフィードエントリを取得し、私のGoogleリーダーアカウントは購読している1600のソースからフィードエントリを収集します。このような商用利用にGoogle Readerを使用できますか?私はすでに Googleリーダーフォーラムでの質問 を提起し、答えを探しています。ここで誰かが同様の使用法のためにGoogle Readerを使用しているなら、私に知らせてください。

2
None-da

Readerとのインターフェイスにより、フィードを直接プルするよりも処理が改善されますか?

フィードを分析(および強化?)している場合、処理スタックの一部としてCalaisやSolrのようなものを実行していると思います。 1600のフィードを使用すると、処理するエントリの数が非常に多くなります。 Readerは、サービスを適切に保つのに十分な速さでエントリをプルするのに十分な帯域幅を提供しますか?

スケーラブルなクラウドスペース(EC2アカウントなど)で処理および強化マシンを仮想化し、処理スケジュールを設定することは、Googleからのこのような大量の投稿をドラッギングするよりもはるかに効率的であると想像する必要があります。

それはともかく、 Google利用規約 には悪いニュースと思われるいくつかのエントリがあります:

5.3ユーザーは、Googleとの別の契約で明確に許可されていない限り、Googleが提供するインターフェース以外の方法でサービスにアクセスしない(またはアクセスを試みる)ことに同意します。お客様は、自動化された手段(スクリプトまたはWebクローラーの使用を含む)を介してサービスにアクセスしない(またはアクセスを試みる)ことに特に同意し、サービスに存在するrobots.txtファイルに記載されている指示に従うことを確認するものとします。

スクリプトを使用して1600フィードアカウントをクロールすると、違反になる可能性があります。

5.4お客様は、サービス(またはサービスに接続されているサーバーおよびネットワーク)を妨害または混乱させるいかなる活動にも関与しないことに同意します。

Googleがフィードを解析して処理し、その帯域幅を使用すると、Readerの通常の動作が妨げられる可能性があります。

5.5 Googleとの別の契約で明確に許可されていない限り、いかなる目的でも本サービスを複製、複製、コピー、販売、取引、または再販しないことに同意するものとします。

この最後の質問は、あなたの質問にかなり直接的に語っているようです。

6
Matt