私が取り組んでいるWebサイトには、数百のPDFがあります。私は彼らが検索で戻ってくるのを見たことがないと思いますが、外部サイトから直接リンクされています。また、製品ドキュメントであるため、キーワードでいっぱいです。
Googleや他の検索エンジンでクロールするために必要な特別なことはありますか?
GoogleがPDFをより気に入ってくれるようにPDFを作成するための厳格なルールはありますか?例えば、生成中にアドビが作成した壊れたPDFタグをクリーンアップするために、それらをghostscriptで実行する必要がありますか?
Google 間違いなくPDFファイルにインデックスを付けます 検索クエリにfiletype:pdf
を追加することで、PDFファイルだけを検索できます( 例 )。
PDFを最適化するために行うべき主なことは、インデックスを簡単に作成できるようにすることです。
その他のヒントについては、 Optimizing PDF Documents および Search EnginesのPDFを最適化する11のヒント を参照してください。
他の検索エンジンについてはわかりませんが、Googleに関する限り、主なルールはrobots.txtを介してそれらを除外しないことです。
これ は、PDF検索をサポートする最初の発表でした。
ウェブサイトをSEOに準拠させることはSEOに害を与えないように、PDFにアクセスできるようにすることは害になりません。アドビのビルトインアクセシビリティチェッカーは完璧とはほど遠いですが、少なくともこれらの領域を修正することで始めることができます。
私は、おそらく4〜5枚ごとに5分を費やしますが、ほとんどはオンラインで作成したテキストPDFです。ページ数、およびそれらのページの複雑さに応じて、時間が均等に長くなります。
編集を行うAdobe Acrobat Proがあると仮定します。
テーブルのようなより高度な編集や、本当に奇妙なAdobeエラーのために、CommonLookと呼ばれるプラグインを使用します。 CommonLookは仕事を終わらせますが、私はAdobeツールが嫌いであるのと同じくらい嫌いです。
Touch Up Reading Orderツール、Tagsツールバー、Reading Orderツールバー、およびContentツールバーに慣れます。私の仕事は、ウェブに出かける前に完全に準拠したドキュメントを必要としますが、誰でもいくつかの簡単なタグ付けとドキュメントプロパティの恩恵を受けることができます。