ご存知かもしれませんが、次のURLを使用すると、Googleに「ping」してサイトマップのレコードを更新できます。
https://www.google.com/ping?sitemap=URLOFSITEMAP.xml
私はすべての記事の提出後にこれをプログラムで行うためのスクリプトを作成しました(私はユーザーが投稿したブログタイプのサイトを作成しています)。
提出するたびにこれを行うのは悪い考えだと思いますか。毎日または一定の間隔を置いてこれを行う方がよいでしょうか。
これは、これを行うとアプリケーションの実行が停止する可能性があるかどうかにかかっていると思います。 pingは非同期で行われないので、常にチャンスがあると思います。誰かがこれをプログラムで実装したのか、そして彼/彼女のアプローチは何だったのか、私はただ疑問に思っていました。
はい、そのメソッドは googleで許可されています です。
次のURLにリクエストを発行します。
www.google.com/webmasters/tools/ping?sitemap=sitemap_url
たとえば、サイトマップが http://www.example.com/sitemap.gz にある場合、URLは次のようになります。
www.google.com/webmasters/tools/ping?sitemap=http://www.example.com/sitemap.gz
/ ping?sitemap =の後のすべてをURLエンコードします:
www.google.com/webmasters/tools/ping?sitemap=http%3A%2F%2Fwww.yoursite.com%2Fsitemap.gz
Wget、curl、または選択した別のメカニズムを使用してHTTPリクエストを発行します。
追加:
私がちょうど与えたリンクに基づいて、そこに情報があります、グーグルは言います:
サイトマップを再送信するのは1時間に1回以下にすることをお勧めします。
Wordpressの Googleサイトマップジェネレータプラグイン のコードを見てください。多くの人がそれを使用していて、気付くほど遅くなるようには見えません。彼らが使用している方法論が何であれ、始めるのに良い場所であるはずです。
2015年の時点で、Googleはドキュメントでレート制限を提案しなくなりました。
新鮮な記事がいつ作成されるかを知ることはGoogleの最大の関心事であるため、サイトマップ、または新しい記事が公開されたときに少なくともある種の「新鮮な記事」サイトマップでそれらをpingする価値があります。
Googlebotは、pingを実行するたびにサイトマップをリクエストします。リソースの新しさをチェックするためにリクエストヘッダーを送信します。したがって、サイトマップを頻繁に送信する予定がある場合は、サーバーがリクエストを正しく処理することを確認してください。そうしないと、304(変更なし)が返され、Googlebotが実際にファイルを取得しません。