Baiduウェブマスターツール、使用可能なすべてのツール、つまり直接URL送信、サイトマップ、JavaScriptスニペットを使用して送信したウェブサイト(Wordpressブログ、カスタム.netドメイン、ドイツでホスト)を持っています新しいリンクを自動送信します。すべての手動送信では、エラーは発生せず、問題を示すものは何もありません。ただし、単にクロールされないだけですまったく。ただし、GoogleとBingの両方で問題なく動作します。
このページはHTTPS(Let's Encrypt)を使用しており、HTTPSへの自動リダイレクトが行われていますが、問題のないドキュメントを理解している限り、HTTPSに関するレポートでも証明書に問題はありませんでした。また、VPNがなくてもページにアクセスできるので、その面で問題がないとは思いませんでした。
これをデバッグし始める方法についての良い指針はありますか?
robots.txt
:
User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
おっと、このアプローチとバイドゥはニースをまったくプレイしません...
1) https://en.greatfire.org/analyzer を使用して、ドメインが「Great Firewall」によってブロックされているかどうかを確認します。もしそうなら、申し訳ありませんが、「不快な」何かがあり、あなたがあなたが検閲を回避しようとして何をしようとも、あなたのサイトは再びブロックされるでしょう。しかしそうでなければ:
2) http://www.webkaka.com/webCheck.aspx を使用して、中国のクライアントからドメインにアクセスできるかどうかを確認します。そうでない場合は、中国のCDNでサイトをミラーリングし、中国のccTLDを使用してください。あなたが200の束を手に入れたら、それから:
3)クローラーがBaidubotになりすましてページを正しくレンダリングできることを確認します。レンダリングが不十分なため、実質的に空白のページは、ツールのレポートを何らかの方法で通過しても、インデックスが作成される前に停止されます。 Chrome拡張または https://technicalseo.com/tools/fetch-render/ を使用します。それが本当にファンキーに見える場合は、Javascript、Ajax、使用している「豊富な」エクスペリエンスWebテクノロジーなら何でも合格します。
4)APIを介してバイドゥにURLをプッシュしてみます。これは簡単ではありません。
そこにクライアントのためのサイトを立ち上げるときに私は同じ問題を抱えていました。 Baiduにサイトを送信する場合、中国でホストされる完全に中国のサイトを想定しています。 Wordpressサイトに完全に翻訳されたマンダリンバージョンを提供できない場合は、これをHTMLに追加してみてください。
<META HTTP-EQUIV="Content-Language" CONTENT="ZH">
上記のメタタグをhtml/phpページの少なくとも1つに配置すると、Baiduに、コミュニティガイドラインに従って要件である中国のサイトがあることを知らせ、サイトを再送信します。
幸運を!
私は特にこの問題に対処していなかったので、私はこれを書いているときに「大声で考えています」。
私は特にBaiduに関心がありませんでしたが、私の理解はそれが中国のソーシャルメディアサイトであることを理解しているためです。
上記のいずれも実行可能に思えない場合は、他のいくつかのフォローアップ質問をする必要があります:
hreflang
タグを実装しましたか?上記を熟考してもニーズに合わない場合は、次のようなプロモーションの他の方法(プログラムおよびマニュアル)を検討しましたか?
最後ですが少なくとも:
Edit Your Robots.txt file
WordPress wp-admin
など)への参照をrobots.txt
ファイルから削除することも、おそらく悪い考えではありません。WordPress 「noindex」ディレクティブ(メタタグではなくHTTPヘッダーの場合がある)を使用してwp-admin
をクロールしないように検索エンジンに自動的に指示します。
そうでない場合でも、robots.txt
ファイルで、ワードプレスを実行しているWebサイトがあることを世界中に通知しますか?
誤解しないでください、私はWordPressを愛しており、ほとんどのWebサイトはそれを利用していますが、CMSはセキュリティの観点から脆弱性を公に発表することにもなるため、人気があります。
robots.txt
をお試しください
User-agent: *
Allow: /