web-dev-qa-db-ja.com

サイトマップのurl> lastmodとはどういう意味ですか?

XMLサイトマップファイルは sitemaps.org で指定されています。 urlset > url > lastmodの説明には

ファイルの最終変更日。この日付はW3C Datetime形式である必要があります。この形式では、必要に応じて時間部分を省略し、YYYY-MM-DDを使用できます。

このタグは、サーバーが返すことができるIf-Modified-Since(304)ヘッダーとは別であり、検索エンジンは両方のソースからの情報を異なる方法で使用する場合があることに注意してください。

これは紛らわしいです。 「ファイル」という用語は、XML sitemap.xml(または、sitemapindexを構成するファイル)を指す場合にのみ使用されます。なぜこの部分はurlタグの一部なのですか?同じXMLファイル内の2つのURLで値が異なる可能性はありません。また、「If-Modified-Since」 リクエストヘッダー であり、RFC準拠のWebサーバーから返されることはありません。

対照的に、sitemapindex > sitemap > lastmodの説明は非常に明確であり、理にかなっています(「ファイル」という用語の使用に注意してください)。

対応するサイトマップファイルが変更された時刻を識別します。そのサイトマップにリストされているページのいずれかが変更された時間には対応していません。

これはXMLサイトマップの標準仕様ですか?新しい改訂版はありますか?または、できればGoogleからの正式な説明がありますか?

2
Peter

Googleの XMLサイトマップとRSS/Atomフィードのベストプラクティス に出くわしました。これは、lastmodを次のように説明しています。

最終変更時刻は、ページのコンテンツが有意に変更された最後の時刻でなければなりません。変更が検索結果に表示されることを意図している場合、最終変更時刻はこの変更の時刻でなければなりません。

興味深いことに、このドキュメントは、単一ファイルの最大非圧縮サイズが50µMBではなく10µMBであると言って、sitemaps.orgの仕様と矛盾しています。なんて混乱だ。

3
Peter