web-dev-qa-db-ja.com

Google Webmaster Toolsは、私のXMLサイトマップは「HTMLページのように見える」と言っています

私たちは多くのサイトを運営しており、ウェブマスターツールでこれらのエラーの多くを取得し始めました。

サイトマップはHTMLです
サイトマップはHTMLページのようです。代わりに、サポートされているサイトマップ形式を使用してください。

問題のあるサイトマップの1つ:

<?xml version="1.0" encoding="UTF-8"?> 
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> 
    <url> 
        <loc>http://www.same_domain.co.uk/folder/file1.shtml</loc> 
        <lastmod>2011-05-11</lastmod> 
        <changefreq>weekly</changefreq> 
        <priority>0.5</priority> 
    </url> 
    <url> 
        <loc>http://www.same_domain.co.uk/folder/file2.shtml</loc> 
        <lastmod>2011-05-11</lastmod> 
        <changefreq>weekly</changefreq> 
        <priority>0.5</priority> 
    </url> 
    <url> 
        <loc>http://www.same_domain.co.uk/folder/file3.shtml</loc> 
        <lastmod>2011-05-11</lastmod> 
        <changefreq>weekly</changefreq> 
        <priority>0.5</priority> 
    </url> 
    <url> 
        <loc>http://www.same_domain.co.uk/folder/file4.shtml</loc> 
        <lastmod>2011-05-11</lastmod> 
        <changefreq>weekly</changefreq> 
        <priority>0.5</priority> 
    </url> 
</urlset>

なぜGWTはこれがXML以外だと考えるのでしょうか?

(サーバー:IIS)


編集:

「この文書は整形式のXMLとして正常にチェックされました!」 -W3Cバリデーター。


編集:

2つの問題のあるサイトマップを再送信しました。1つは変更なし、もう1つはXMLとして扱われるように2、3行追加しました。 「Fetch as Googlebot」診断ツールを実行しました。両方とも今は大丈夫です。 「サイトマップはHTML」エラーですべてのサイトマップを再送信するだけです

問題は残っています:

なぜこれが起こったのですか? GWTがこれらのXMLサイトマップをHTMLと見なしたのはなぜですか?

6
Adam Lynch

Farseekerの提案は、トラブルシューティングの最初の良いステップです(text/html content-typeがこの結果を確実に生成します)-サイトマップファイルに無効なXMLが含まれている場合、Google Webmaster Toolsはdifferentエラーメッセージを表示します。

問題の一時的な性質を考えると、サーバーログをチェックして、Googleの以前のリクエストでエラーページが生成されたかどうかを判断しましたか?

サイトマップファイルを動的に生成している場合、スクリプトエラー、データベースタイムアウトなどの問題により、HTMLエラーページが断続的に生成される可能性があります。

2
danlefree

content-typeヘッダーがあるため、それが吐き出されます。お気に入りのツール(Firebugなど)で検査し、送信内容を確認します。

3
Mark Henderson

ヘッダーを拡張して、スキーマのものを含めることができます。

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">

そして オンライン検証

合格した場合、Googleの問題であるに違いありません。

1
paulmorriss

Webサーバー側から問題がないか確認してください。または、Google IPがブロックされている場合。ログベースの追跡システムを使用している場合は、Googleボットのアクティビティを分析してみてください。最近、同じ問題が発生し、GoogleがIPアドレスを変更したため、データマイニングのためにGoogleボットのクロールを許可していませんでした。問題は最終的に解決されました。

0
Tapan Patel