GoogleはPDFを含むWebサイトをクロールしますが、PDFに含まれるコンテンツはSEOランキングに影響しますか?
WebサイトにPDFを掲載したいのですが、結果が急降下するのを見たくありません。
robots.txtディレクティブを追加してそれらを除外できることはわかっていますが、必要がない場合はこれを行いたくありません(そして、クローラーがインデックスを作成するだけでなく、クローラーを信頼しないでください)とにかく)。
Googleの目には、 a PDFは単なる別のWebページです –競合他社に先んじてコンテンツを後押しする絶好の機会を提供するWebページです。
私が言う理由は、GoogleがSERPのPDFファイルをランク付けするからです。 PDFファイルを確実にクロールします。 PDFコンテンツが新鮮で関連性がある場合、Webサイトの評判が向上します。 PDFファイルが破壊的だと思われる場合は、クローラーから常に保護することをお勧めします。
User-agent: *
# Block the /pdfs/directory.
Disallow: /pdfs/
# Block pdf files. Non-standard but works for major search engines
Disallow: *.pdf
<a href="something.pdf" rel="nofollow">Download PDF</a>
x-robot-tags
を使用して、インデックスを作成しないようにすることもできます HTTP/1.1 200 OK
Date: Tue, 25 May 2010 21:42:43 GMT
(…)
X-Robots-Tag: googlebot: nofollow
X-Robots-Tag: otherbot: noindex, nofollow
(…)
最初の2つのポイントに従う場合。 PDFは、SEOの内容に関係なく、SEOに影響しません。
PDFの素材がサイトの素材に関連している場合、サイトのテーマを希釈することはありません。それらは検索エンジンによって読み取られます。たとえば、「test filetype:pdf」を検索すると、「test」という単語を含むPDFが表示されます。
質問を言い換えて答えを簡単にする:PDFのコンテンツがHTMLファイル形式である場合、サイトを傷つけますか?一般的に言えば、コンテンツは良いです。
PDFコンテンツが一意であれば、問題はないはずです。 PDFコンテンツが別のページとまったく同じ場合、問題がある可能性があります。
この状況では、正規リンクを使用します。残念ながら、PDFでは正規のリンクを指定することはできませんが、 this Googleウェブマスターツールの回答に示されているように:
サーバーを構成できる場合は、rel = "canonical" HTTPヘッダーを使用して、HTMLドキュメントおよびPDFなどの他のファイルの正規URLを示すことができます。