最近、私のサイトは「ログインのみ」のため拒否されました:
ログインのみ:ウェブサイトの確認中に、サイトのページの大半がログインの背後にあるか、アクセスが制限されていることがわかりました。ログイン保護されたページのアプリケーションは、プログラムに受け入れられるかどうかコンテンツを確認できないため、承認しませんのでご注意ください。
サイトはコンテンツを送信するためにログインを必要としますが、ページを表示するためにログインを必要としません。すべてのコンテンツは公開されていますが、投稿するには登録が必要であることをGooglebotまたはAdSenseにページをクロールするために使用されるものに伝えるにはどうすればよいですか?
現在のrobots.txt
User-agent: *
Disallow: /moderation/
User-agent: Googlebot-Image
Disallow: /
User-agent: Mediapartners-Google
Allow: /
同じ問題があり、解決しました。
Googleはクローラーを送信してサイトにアクセスします。それは自動ロボット制御であり、人間の制御ではありません。このクローラーからの拒否も自動的に行われます。
クローラーがサイトにアクセスしたときに実際にクローラーが取得するものを確認するには、 Lynx のようなテキストWebブラウザーを使用する必要があります。このブラウザを使用した後、私は私の問題が何であるかを見ました:
A
要素(span
など)内にネストされた他の要素がある場合、クローラーはそれをリンクとして認識しません。クローラーの場合、クリーンリンクは1つしかなく、ログインページへのリンクでした。Lynxブラウザーでページを見て、拒否される理由を見つけてください。