サイトでGoogle CSEを使用しています。新しいエンティティが公開されるとすぐに、すぐにsitemap.xmlレンダリングスクリプトにも追加されます。 Googlebotが新しいサイトマップを取得してから、CSEで新しいエンティティを検索できるようになりますか?
先週、いくつかのエンティティを追加しました。ウェブサーバーのログを確認し、Googlebotは4月10日にサイトマップを最後にダウンロードし、同時に新しいエンティティページにアクセスしました。今日は4月12日で、CSEと次のような通常のGoogle検索の両方で新しいアイテムが見つかりません
"my entity name" site:mysite.com
これは正常ですか?いつから新しいページを見つけることができますか?既にインデックスが作成され、定期的に更新されている他のサイトページからの内部リンクがある場合とない場合がありますが、新しいアイテムは常にサイトマップに追加されます。
Googleがサイトをクロールしてからインデックスで利用できるようになるまでの固定時間はありません。数年前は、Googleがメインインデックスをバッチで再構築するため、コンテンツが追加されるまでに最大6週間かかりましたが、現在はライブ更新により時間がかかりますが、いつでもインデックスに追加できますサイトがクロールされてから数日から数週間後。それは多数の要因に依存しますが、その多くはGoogleがプロプライエタリと分類するためリリースしません。
URLを送信したら、Googleがリクエストを処理し、ページをクロールしてインデックスを作成するまでしばらく待つ必要があります。また、Googleは複雑なアルゴリズムに基づいてインデックス付けされたマテリアルを更新するため、Googleがすべての変更をインデックス付けすることを保証できないことを理解してください。
-Googleから( https://support.google.com/webmasters/answer/6065812?hl=en )
ページをより速くインデックスに登録する場合は、サイトマップにページを追加する以上のことを行う必要があります。サイトマップはリンクジュースをページに渡しません。また、Googleは通常、リンクジュースのないページをインデックスに登録しません。詳細については、 The Sitemap Paradox をご覧ください。
サイトの他のページから新しいページをリンクする必要があります。たとえば、ホームページに「最近公開された」リストを持つ価値があるかもしれません。ホームページは、PageRankの高いページであり、通常、そこにリンクされているアイテムをインデックスに登録するのに十分なリンクジュースを渡すことができます。
検索エンジンに新しいコンテンツを知らせる別の方法は、それらに警告するpingサービスを使用することです。ブログソフトウェアWordPressにはこの機能が組み込まれており、 実行方法を説明するwikiページ があります。彼らは主に Ping-O-Matic に依存して、更新されたコンテンツに関するさまざまな検索エンジンにWordを広めます。
Google検索エンジンではないGoogleカスタム検索エンジンについてです。これは、サイトがサイト用のカスタム検索エンジンを持つことができる機能です。これは、少なくともサイト検索機能です。
これらの間にいくつかの関係がありますが、これらは2つの異なるものです。
サイト所有者がGoogle CSE機能を選択して実装し、すべてのサイトページがGoogle検索エンジンにインデックス付けされていない場合、どうなりますか?
Googleは、CSEのお客様のために、すべてのサイトページが迅速にインデックス化されることを保証します。これは、邪魔になるサイトにペナルティがないことを規定しています。最近、2015年のすべての更新で状況が十分に変化しました。ペナルティが邪魔になる可能性が高いため、ペナルティが存在しないことをサイトが確認することが最も重要です。
Googleはページを完全に再取得し、まだ表示されていない以前に不明なページを取得します。サイトマップを監査として使用して、すべてのページがフェッチされることを確認します。 Googleはこれを非常に迅速に実行しようとしますが、サイトのサイズと速度によっては、数週間または数か月かかる場合があります。
CSEが完全であることを確認するため。 Google検索エンジンとカスタム検索エンジンは、同じインデックスを使用して機能します。サイトのインデックスが完全に作成されていない場合、CSEの顧客であることにより、Googleは少なくともサイト全体のインデックス作成を試行します。
Googleの通常の動作に戻りますが、その多くはあなた次第です。
自問してください:
すべてが正常であると仮定すると、Googleは新しいページを非常にすばやく表示します。そうでない場合は、上記のすべての要因に応じてかなり時間がかかります。つまり、数分または数週間かかる場合があります。まれに、数ヶ月間。
いいえ。常にではありません。 Googleは、サイトページを適切に取得できるかどうかを監査するためだけにサイトマップを使用することを選択する場合があります。これは一般的です。 Googleは驚くほど古い学校です。可能な場合はすべてのサイトに対して常に最初から行っているため、サイトのインデックスを作成し続けます。ほとんどの場合、サイトマップを使用しても、ログインページやペイウォールの背後にあるページがないサイト、または巨大なサイトにはメリットがありません。
そのため、サイトマップにページを追加しても、ほとんど何の効果もありません。ホームページなど、重要な場所に新しいページへのリンクがあることが重要です。
いいえ。サイトマップにリンクされていないページがリストされている場合、Googleはそれらを取得してインデックスを作成します。ただし、Googleはこれを好みません。 Googleは、すべてのページをサイト自体から利用できるようにする必要があると考えています。 Googleはまた、サイトマップで見つかったリンクされていない多数のページがスパムサイトのシグナルであると考えています。彼らはこれに関してもっと間違っているはずがありません。このため、サイト上のリンクに続いて見つかったページは最初にインデックスされ、ページはサイトマップで次に検索されます。これは厳密には当てはまらない可能性がありますが、一般的には間違いなく十分に近いです。
あなたと私は、膨大な数のページをリンクすることは不可能であり、Googleもナビゲーションページを好まないことを知っています。また、これらのページは扱いにくく、ユーザーエクスペリエンス(UX)に悪影響を及ぼす可能性があります。私はずっと前に鉱山を落とし、CSEを有効な代替品として使用するつもりでした。
あまりよくない。それは残念です。ウェブマスターがサイトマップを使用してサイト内のすべてのページをGoogleに通知し、CSEをユーザーが効果的にリンクできないコンテンツを見つけるためのメカニズムとして使用する絶好の機会です。
グーグルは、そうでなければ彼らが作成したこの完璧なプロセスで不機嫌そうなクマのようです。サイトにリンクされていないページをサイトマップに持っていることであなたをbeatり、欲求不満でナビゲーションページを介してこれらのページをリンクしようとするとあなたをbeatり、サイトマップで見つかったページをインデックスするリンクから見つけた。
さらに、サイト検索はそれほど人気のある機能ではなく、ほとんどのサイトで十分に活用されていないようです。ユーザーをサイト検索ユーザーに変換することは困難です。悲しい事実です。ほとんどがSERPに戻り、次のクリックがサイトに戻っても検索を続けます。クレイジーだよね?