Googlebotが見出しやコンテンツを見つけたことを何らかの方法で、たとえばワード数で確認する方法はありますか?
Screaming Frogと呼ばれるプログラムを試しましたが、これは検証済みのページで最初の<h1>
を取得することすらできず、すべてのページの約1/3(!)で安全ではなかったためです。ウェブマスターツールではサイトの見栄えが悪いように見えますが、Googlebotに似たコンテンツクローラーが自分のページで何を見つけ、どのような順序で見つけているのか知りたいです。そのようなツールに関するヒントはありがたいです。
これはnotキーワード数についてです。
私は主に本文のテキストに興味があります。
このためのツールは必要ありません。Google検索で次のコマンドラインを入力して、ページが表示されるかどうかを確認してください。
keyword site:example.com
keyword
として、見出しまたはページコンテンツのみにあるWordを選択します。 example.com
として、サイトを選択して検索をサイトに制限します。
<h1>
見出しのすべてのキーワードがページコンテンツにも含まれている場合、タグがGoogleによってインデックス付けされていることを確認するには、このコマンドツールを入力して、ページが表示されるかどうかを確認します。
"your exact match <h1> tag text" site:example.com
引用符を忘れないでください。
さらに、ウェブマスターツールを使用すると、Googlebotがページをどのように認識しているかを確認するための特定のツールを使用できます。サブメニュー「Fetch as Google」(「クロール」メニューの下)を探し、ページのURLを調べて、Googlebotで結果を確認します。ページに問題がない場合は、見出しとページコンテンツが表示されます。
Googleがコンテンツをクロールしてインデックスを作成したことを確認するには、インデックスを作成するキーワードで検索を行うだけです。たとえば、次のような見出しがあります:
<h1>The h1 heading on my site</h1>
Googleで「The <h1>
heading on my site」というフレーズを検索してみてください。 SERPにキーワードとWebサイトのページへのリンクが含まれる場合は問題ありません。Googleはページの見出しとコンテンツのインデックスを作成しました。
追伸:Webサイトをクロールして見出しを確認する別の方法(スクリーミングフロッグの代わりとして)、 Site Visualizer website crawler を試すことができます。