Webサイトのインデックスページを確認すると、252ページのみがインデックスに登録されていますが、site:http://www.example.com
と入力してGoogle検索で確認すると、900ページ以上がインデックス登録されています。
この問題は何ですか?また、ウェブサイトツールでXMLサイトマップを送信し、ページ数が900+を送信しましたが、なぜインデックスが低く表示されるのですか?
インデックスが作成されたURLは、サイトマップのURLと正確に一致していますか?その場合、それらは「インデックス化された」もの内でカウントする必要があります。
数百の不一致がある場合は、URLをサイトマップのURLと比較してみてください。 Googleは、送信されたものとは異なるURLをインデックスに登録している可能性があります。ウェブサイトのバージョンが間違っているか、検索やカレンダーページのようなインデックスに登録したくない関連性のないURLなどです。
これは、物事の組み合わせに関係しています。サイトマップは、インデックスを作成する対象をGoogleに実際に伝えません。それは他の何よりもクモのためのガイドです。実際、サイトマップがなくても、ウェブサイトをGoogleに送信した場合は、クロールされます。
Site:domain.comに非常に多くの情報が表示される問題は、検索エンジンのスパイダーにとって、URLで開かれる可能性のあるものすべてがページであるためです。これは、WordPressサイトで最も頻繁に発生します。たとえば、ウーコマースのWordPressがある場合、技術的にはすべての製品を独自のページで開くことができます。次のようになります。
www.example.com/category1/products/product1/variation1
したがって、5つのカテゴリに分けられた40の製品があり、各製品に3つのカラーバリエーションまたはサイズがある場合。実際にはサイト構造やサイトマップにない125ページがあります。それらのうちの120はあなたにとって良いかもしれませんが、5つのカテゴリーページは役に立ちません。
robot.txtファイルで作業を行います。 site:domain.comから表記を作成し、SEO値を提供しないすべての404とすべてのページを禁止します。 (例:利用規約、プライバシーポリシー、カテゴリページ、タグページ、クリックすると独自のページに表示される写真など)
site:
検索を行うときに得られる結果の数を信頼することはできません。 Googleウェブマスターツールの数値はより正確になります。
まず、 サイトの検索だけでなく、すべての検索でGoogleから返される結果の数は、多くの場合、かなり純粋です 。リンクされた記事では、この理由について詳細に説明し、GoogleのMatt Cuttsからの次の引用を含みます。
結果の推定値がまさにその推定値であることを非常に明確にしようとしています。理論的には、システムのその側面にサイクルを費やすことはできますが、実際には他にも多くの作業を行う必要があり、より正確な結果の見積もりは他の多くのことよりもリスト上で低くなります。
site:
検索の場合、Googleは意図的に結果の情報をやや少なくしようとします。これは、特別に細工された検索を行うことで、人々がインデックスを作成し、Googleやインデックスに登録しているWebサイトに関する知識を過度に深めないようにするためです。この場合、Googleは、認証済みのウェブマスターコンソールを使用して、ウェブマスターであるあなただけにサイト上のインデックスページの数を表示することにしました。彼らは意図的に不正確な数を公衆に示しています。彼らはあなたのサイト上のインデックス付きドキュメントの数はあなたが知っているべきであり、Googleは知るべきであると信じていますが、それはあなたの秘密であるべきです。