web-dev-qa-db-ja.com

Wordpressバイドゥに送信されたサイトがクロールされない

Baiduウェブマスターツール、使用可能なすべてのツール、つまり直接URL送信、サイトマップ、JavaScriptスニペットを使用して送信したウェブサイト(Wordpressブログ、カスタム.netドメイン、ドイツでホスト)を持っています新しいリンクを自動送信します。すべての手動送信では、エラーは発生せず、問題を示すものは何もありません。ただし、単にクロールされないだけですまったく。ただし、GoogleとBingの両方で問題なく動作します。

このページはHTTPS(Let's Encrypt)を使用しており、HTTPSへの自動リダイレクトが行われていますが、問題のないドキュメントを理解している限り、HTTPSに関するレポートでも証明書に問題はありませんでした。また、VPNがなくてもページにアクセスできるので、その面で問題がないとは思いませんでした。

これをデバッグし始める方法についての良い指針はありますか?


robots.txt

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
2
ferada

おっと、このアプローチとバイドゥはニースをまったくプレイしません...

1) https://en.greatfire.org/analyzer を使用して、ドメインが「Great Firewall」によってブロックされているかどうかを確認します。もしそうなら、申し訳ありませんが、「不快な」何かがあり、あなたがあなたが検閲を回避しようとして何をしようとも、あなたのサイトは再びブロックされるでしょう。しかしそうでなければ:

2) http://www.webkaka.com/webCheck.aspx を使用して、中国のクライアントからドメインにアクセスできるかどうかを確認します。そうでない場合は、中国のCDNでサイトをミラーリングし、中国のccTLDを使用してください。あなたが200の束を手に入れたら、それから:

3)クローラーがBaidubotになりすましてページを正しくレンダリングできることを確認します。レンダリングが不十分なため、実質的に空白のページは、ツールのレポートを何らかの方法で通過しても、インデックスが作成される前に停止されます。 Chrome拡張または https://technicalseo.com/tools/fetch-render/ を使用します。それが本当にファンキーに見える場合は、Javascript、Ajax、使用している「豊富な」エクスペリエンスWebテクノロジーなら何でも合格します。

4)APIを介してバイドゥにURLをプッシュしてみます。これは簡単ではありません。

3
ICap

そこにクライアントのためのサイトを立ち上げるときに私は同じ問題を抱えていました。 Baiduにサイトを送信する場合、中国でホストされる完全に中国のサイトを想定しています。 Wordpressサイトに完全に翻訳されたマンダリンバージョンを提供できない場合は、これをHTMLに追加してみてください。

<META HTTP-EQUIV="Content-Language" CONTENT="ZH">

上記のメタタグをhtml/phpページの少なくとも1つに配置すると、Baiduに、コミュニティガイドラインに従って要件である中国のサイトがあることを知らせ、サイトを再送信します。

幸運を!

2
Waleed

私は特にこの問題に対処していなかったので、私はこれを書いているときに「大声で考えています」。

私は特にBaiduに関心がありませんでしたが、私の理解はそれが中国のソーシャルメディアサイトであることを理解しているためです。

  • ユーザーはサブドメイン(Googleサイト、Blogger、WordPress.comなど)を作成できますか?
  • ユーザーはマップリストを作成できますか?
  • バックリンク付きの広告を投稿できる、Craig's Listに相当する中国語はありますか?
  • 彼らはどんなタイプの有料広告も許可しますか(それは彼らを新しい広告主のウェブサイトに効果的に警告します)?

上記のいずれも実行可能に思えない場合は、他のいくつかのフォローアップ質問をする必要があります:

  • その内容は中国政府に不快なものですか?
  • プログラムでフラグが付けられる可能性のあるコンテンツ(ポルノなどの肌のトーン)はありますか?
  • コンテンツは中国語であり、hreflangタグを実装しましたか?

上記を熟考してもニーズに合わない場合は、次のようなプロモーションの他の方法(プログラムおよびマニュアル)を検討しましたか?

  • (WordPress管理領域)で)中国市場に関連する可能性が高いサーバーに特に注意してコンテンツを更新するたびに、サービスのリストを「ping」に拡張しますか?
  • ソーシャルメディアを介して中国の人々に働きかけていますか?
  • バイドゥによってスパイダーされる可能性が高いあなたの業界で注目のブログにコメントしますか?
  • あなたのウェブサイトを中国のディレクトリ、ブックマークサイト、URL短縮サービスなどに提出しますか?

最後ですが少なくとも:

  • (そして、これは最後の質問に基づいています)Baiduがスパイダーする可能性が高いサイトからリンクを構築し、それらのリンクに "ping"(つまり、段階的なリンク構築)を試みましたか?

Edit Your Robots.txt file

WordPress wp-adminなど)への参照をrobots.txtファイルから削除することも、おそらく悪い考えではありません。WordPress 「noindex」ディレクティブ(メタタグではなくHTTPヘッダーの場合がある)を使用してwp-adminをクロールしないように検索エンジンに自動的に指示します。

そうでない場合でも、robots.txtファイルで、ワードプレスを実行しているWebサイトがあることを世界中に通知しますか?

誤解しないでください、私はWordPressを愛しており、ほとんどのWebサイトはそれを利用していますが、CMSはセキュリティの観点から脆弱性を公に発表することにもなるため、人気があります。

robots.txtをお試しください

User-agent: *
Allow: /
1
adam-asdf