web-dev-qa-db-ja.com

ページのpdfの最初の数ページを表示する=コンテンツが重複していますか?

私は自分のウェブサイトにscribd PDFを埋め込みます。これらは試験紙PDFであり、他のWebサイトで入手できます。

Scribdは埋め込み/ iframeであるため、Googleはページがコンテンツのない空のページであると見なしています。 Googleはiframeコンテンツを正しく表示しますか?

そこで、GoogleのページにPDFの最初のページをテキストとして表示することにしました。次に、ユーザーエクスペリエンスのために、テキストを非表示にし、JavaScriptを使用してscribd埋め込みコードに置き換えます。

この方法には2つの心配があります。まず、PDFの最初のページを表示しています。後者は他のWebサイトでホストされている可能性があり、これは重複コンテンツと見なされます。

次に、コンテンツを非表示にし、JavaScriptで埋め込まれたscribdに置き換えます。グーグルによって悪いと考えられていますか?

2
Ace

Scribdは埋め込み/ iframeであるため、googleはコンテンツがなく空のページであると見なします。グーグルはiframeコンテンツを正しく見ていますか?

フレームに関するGoogleのヘルプページ から:

Googleは、可能な限りフレームとiframeをサポートしています。フレームはWebの概念モデルに対応していないため、検索エンジンに問題を引き起こす可能性があります。このモデルでは、1ページに1つのURLのみが表示されます。フレームまたはiframeを使用するページは、単一のページ内に複数のURL(フレームごとに1つ)を表示します。 Googleは、フレーム化されたコンテンツをフレームを含むページに関連付けようとしますが、そうすることを保証するものではありません。

あなたがこのscribd iframeを使用している唯一のサイトではない場合、Googleはそのコンテンツを他のサイトに帰属させるか、または自分自身をscribdすることさえできます。


まず、pdfの最初のページを表示していますが、後者は他のWebサイトでホストされている可能性があります。これは重複コンテンツと見なされます。

はい、これは確かに重複したコンテンツです。おそらく重複したコンテンツに対してペナルティは課されませんが、ページ上にテキストがあると、scribdでiframeを表示する以上の助けにはなりません。 Googlebotは、複数の場所でコンテンツを検出すると、通常、そのうちの1つだけをインデックス化します。サイトが元の、最も権威のある、または最も使いやすいサイトでない限り、Googleはおそらく別のサイトを選択します。詳細については、「 重複コンテンツとは何ですか?また、自分のサイトでペナルティを受けないようにするにはどうすればよいですか?


コンテンツを非表示にし、JavaScriptで埋め込まれたscribdに置き換えています。それはグーグルによって悪いと考えられていますか?

Googlebotとユーザーに異なるコンテンツを表示することは、「 cloaking 」と見なされます。 Googleは、コンテンツの複製よりもクローキングをはるかに容易に罰します。この場合、ユーザーに表示しているのと同じことをGooglebotに表示しようとしているので、大丈夫かもしれませんが、まだリスクがあります。

1