ゲームサイトがあり、SEデータダンプのコピーから関連するQ&Aを取得するAPIを書いています。すべてのライセンスルールを順守します。
そうは言っても、Googleは重複したコンテンツを提供することでサイトにペナルティを科すため、これを行うのをためらいます。
検索エンジンのペナルティを負うことなく、ライセンス条項に従ってデータダンプコンテンツを提供する合法的な方法はありますか?このコンテンツを提供したいのですが、ウェブサイトの主な機能を侵害したくありません。
Google APIを使用してコンテンツを母国語に翻訳する予定です。英語でコンテンツを提供しません。
というタイトルのGoogleの記事「重複コンテンツを確実に処理する」 から:
「...私たちのアルゴリズムは、英語とスペイン語で書かれた同じ記事を重複したコンテンツと見なしません。」
ライセンスを取得したコンテンツをオリジナルとは異なる言語で複製している場合、Googleはコンテンツをオリジナルとして表示します。
同じ言語でコンテンツを再生している場合は、ソースにリンクして、Googleがあなたのバージョンよりも上位にランク付けされるようにしてください。サイトで複製されたコンテンツには、サイト全体に影響する「重複したコンテンツのペナルティ」は発生しません。これは、特定の同じ言語のページが元のバージョンよりも検索結果で低く表示されることを意味します。
信頼性の高い人間の翻訳のために、 mygengoを使用および推奨します。
翻訳のためにGoogleを使用することは強くお勧めしますが(後で編集する予定がない限り)、Googleはインデックス作成のために他の言語への翻訳に対してコンテンツをチェックしないため、重複するコンテンツに対してペナルティを課されることはほとんどありません。
心配な場合は、サーバー上にrobots.txtファイルを設定して、Google(および他の検索エンジン)にデータダンプコンテンツのインデックスを作成しないように指示してください。ユーザーは情報にアクセスできますが、Googleはそれを無視します。
「robots.txt」を検索すると、これを設定する方法の詳細がすべて表示されます。