web-dev-qa-db-ja.com

Webサイトでsitemap.xmlパスを見つける方法

Webサイトのsitemap.xmlファイルを見つけるにはどうすればよいですか?

例えばstackoverflow/sitemap.xmlにアクセスすると、404が取得されます。

Stackoverflow/robots.txtには次のように書かれています。

「これは技術的には有効ではありません。何らかの理由で、サイトマップのパスは絶対ではなく相対である必要があります。サイトマップ:/sitemap.xml」

38
jacktrades

サイトマップの場所に関する標準はないと思います。これが、Googleのウェブマスターツールを使用してサイトマップを追加するときに、サイトマップに任意のURLを指定する必要がある理由です。

18
maksimov

標準はないため、保証はありません。そうは言っても、次のように、サイトマップが自己ラベル付けされ、ルート上にあることが一般的です:

example.com/sitemap.xml

一部のサーバーでは大文字と小文字が区別されるため、そのことに留意してください。存在しない場合は、ルート上のrobotsファイルを確認します。

example.com/robots.txt

Googleのrobotsファイルヘッドにリストされていない場合は、これを検索します。

site:example.com filetype:xml

これにより、ターゲットドメインのXMLファイルに結果が制限されます。この時点で、試行錯誤が行われ、作業しているWebサイトの詳細に基づいています。上記のGoogle検索フレーズから複数ページの結果が得られた場合は、結果をさらに制限してみてください。

filetype:xml site:example.com inurl:sitemap

または

filetype:xml site:example.com inurl:products

それでも見つからない場合は、right-click > "View Source"および検索を実行します(別名: "control find"またはCtrl + F) ために .xmlは、コード内に参照があるかどうかを確認します。

91
Kirkland

サイトマップの場所は、含めることができるURLに影響しますが、それ以外の場合は標準はありません。詳細な説明が記載された適切なリンクを次に示します。 http://www.sitemaps.org/protocol.html#location

3
Johan Falk

protocol documentation によると、ウェブサイトの設計者が検索エンジンにsitemap.xmlの場所を通知するために使用できる少なくとも3つのオプションがあります。

  • 提供されたインターフェースを介して各検索エンジンに位置を通知する
  • Robots.txtファイルにURLを追加する
  • Http経由で検索エンジンにURLを送信する

そのため、robots.txtファイルでサイトマップの場所を公開することを選択しない限り、sitemap.xmlファイルをどこに配置したかを本当に知ることはできません。

2
Jens

Google検索演算子を使用して見つけてください

以下のコードでグーグルを検索してください。

inurl:domain.com filetype:xml

domain.comをサイトマップを検索するドメインに変更します。これは、指定されたドメインのためにリストされたすべてのxmlファイルをリストする必要があります。すべてのサイトマップを含む:)

2