私たちは多くのサイトを運営しており、ウェブマスターツールでこれらのエラーの多くを取得し始めました。
サイトマップはHTMLです
サイトマップはHTMLページのようです。代わりに、サポートされているサイトマップ形式を使用してください。
問題のあるサイトマップの1つ:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.same_domain.co.uk/folder/file1.shtml</loc>
<lastmod>2011-05-11</lastmod>
<changefreq>weekly</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>http://www.same_domain.co.uk/folder/file2.shtml</loc>
<lastmod>2011-05-11</lastmod>
<changefreq>weekly</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>http://www.same_domain.co.uk/folder/file3.shtml</loc>
<lastmod>2011-05-11</lastmod>
<changefreq>weekly</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>http://www.same_domain.co.uk/folder/file4.shtml</loc>
<lastmod>2011-05-11</lastmod>
<changefreq>weekly</changefreq>
<priority>0.5</priority>
</url>
</urlset>
(サーバー:IIS)
「この文書は整形式のXMLとして正常にチェックされました!」 -W3Cバリデーター。
2つの問題のあるサイトマップを再送信しました。1つは変更なし、もう1つはXMLとして扱われるように2、3行追加しました。 「Fetch as Googlebot」診断ツールを実行しました。両方とも今は大丈夫です。 「サイトマップはHTML」エラーですべてのサイトマップを再送信するだけです
問題は残っています:
Farseekerの提案は、トラブルシューティングの最初の良いステップです(text/html
content-typeがこの結果を確実に生成します)-サイトマップファイルに無効なXMLが含まれている場合、Google Webmaster Toolsはdifferentエラーメッセージを表示します。
問題の一時的な性質を考えると、サーバーログをチェックして、Googleの以前のリクエストでエラーページが生成されたかどうかを判断しましたか?
サイトマップファイルを動的に生成している場合、スクリプトエラー、データベースタイムアウトなどの問題により、HTMLエラーページが断続的に生成される可能性があります。
content-type
ヘッダーがあるため、それが吐き出されます。お気に入りのツール(Firebugなど)で検査し、送信内容を確認します。
ヘッダーを拡張して、スキーマのものを含めることができます。
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9
http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd">
そして オンライン検証
合格した場合、Googleの問題であるに違いありません。
Webサーバー側から問題がないか確認してください。または、Google IPがブロックされている場合。ログベースの追跡システムを使用している場合は、Googleボットのアクティビティを分析してみてください。最近、同じ問題が発生し、GoogleがIPアドレスを変更したため、データマイニングのためにGoogleボットのクロールを許可していませんでした。問題は最終的に解決されました。