web-dev-qa-db-ja.com

Googleは投稿の公開日をどのように認識しますか

Googleで何かを検索すると、その下に投稿/記事の公開日が表示されることがあります。また、Wordpressを使用したサイトで自分の記事を検索しましたが、Googleはその発行日も認識しています。

ウェブサイトのソースを開いても、特別なタグや公開日を示すものは表示されません。それは通常のdivでのみ書かれており、SEに発行日であることを伝える特別なタグは付けられていません(ページの周りに他の日付の日付もあります)。

DOMツリーのWordpress公開日の正確な場所をGoogleにハードコーディングしていますか、それとも何かが足りませんか?

私は自分のCMSを使用して新しいWebサイトを構築しています。日付公開された認識を実装する方法を探しています。

17
Can Poyrazoğlu

xmlサイトマップまたはRSSフィードバージョンを使用して、Google、Yahoo、MSNなどの主要な検索エンジンを通じて公開データのインデックスを作成する必要があります。 WebサイトのXMLサイトマップを生成し、インデックス用のWebマスターツールで送信します。

4
eThan Hunt

Google knowsにもかかわらず、すべてのメインページが4年以上前に更新されているように表示されるという問題がありました。月に。本当に困惑して、本当にイライラして、再び困惑した後、私はついに問題を見つけました。私たちの法的条件は、「最終更新日:2007年10月30日」という隠されたdivで提供され、divはほぼすべてのページに読み込まれていました。 (登録時にポップアップ表示されるため)私はそれを削除しましたが、今では日付が消えるか、より合理的なものに修正されると思います。

技術的な詳細や独自のインデックス作成履歴よりもサイトのセマンティクスを確認しているという警告ともう1つの証拠。

7
mmdanziger

投稿または記事の公開日が、XMLサイトマップの<lastmod>エントリ(他の人が示唆しているように)またはその件に関するLast-Modified HTTPヘッダーに基づいていることは非常に疑わしいです。 XMLサイトマップは単なる助言であり、信頼できるものではありません。文書の最終変更日は、おそらく記事の(元の)発行日と同じではありません。また、ページ上部のコメントで述べたように、ドキュメントの最終変更日はキャッシュと多分クロールレートの決定のためにおそらくより重要です。動的に生成されたページのLast-Modified HTTPヘッダーは、実際の日付/時刻に非常に近いことがよくあります(WordPressブログの場合)。

一方、RSS/Atomフィードには、この特定のナゲットの情報が含まれています。実際、コンテンツに公開日が含まれていないWordpressサイトでは、公開日が引き続きGoogleの検索結果に表示されます。そして、私が知る限り、これはRSSフィードの日付と一致します。

EDIT#1:ただし、RSSフィードには必ずしもすべてのページが含まれているわけではありません。ほとんどの場合、latestまたは最後に更新されたページのみを含める必要があります。しかし、Googleがすでに読んだものをGoogleが忘れてはならない理由はなく、そのページのコンテンツが変更されていない場合、最終更新日も変更されません。

RSSフィードがない場合、Googleはページコンテンツを分析するのに十分賢いと思います。特に、日付が microformats を使用して「意味的に」マークアップされている場合。 Googleに含まれる記事の正式な発行日として、Googleが以下を確認することは完全に実現可能です。

<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>

Googleは確かに microformats -hCard、hReviewなどを読み取ります。

付け加えると、Googleがこれを示唆する権威のあるものを見つけることができなければ、Googleが公開日を述べるとは思わない。不正な「公開日」は誰にとっても役に立たず、Googleはそれを大いに活用するため、投機データの「公開日」を推測することはありません!

そして記録のためだけに(もし@Tomが別の方法で提案しているなら:)投稿/記事には公開日が表示されるべきだと思う。多くの人はそうではなく、これは特に技術的な問題を調査するときに読者を苛立たせる可能性があり、記事の途中まで読んだことが古くなっていることに気付くでしょう!

EDIT#2:私はそれ以来、@ mmdanzigerが彼の答えで詳しく述べているannoyanceを経験しました。私の古いサイトの1つで、everyページの上部に「Site Last Updated Sun 17th June 2012」というテキストがあります(特別な方法でマークアップされていません)(JavaScriptでページに書き込まれます) !!)。このsameの日付はGoogleによって選択され、SERPSに表示されるいくつかの(すべてではない)ページと一緒に表示されます。これは確かにページの公開日ではありません。 Googleは単にページを「最終更新(datestring)」(JavaScriptを処理した!!)という形式の文字列に置き換えているように見えます。この特定のサイトにはRSSフィードがありません。サイトにはSitemap.xmlファイルがありますが、日付は異なります。

他のサイトでも同様の動作に気づきました。

7
MrWhite

GoogleはサイトマップとRSSフィードを使用して公開日を認識していると思います。 Standards に従ってxmlサイトマップを作成することで、この機能をCMSに実装できます。

<lastmod>2011-08-18</lastmod>
5
Vamsi Krishna B

私は、ページ上の日付をインテリジェントに検索し、それが使用する関連日付であると確信していると思います。

SERPクリック可能性にマイナスの影響を与える可能性があると思うので、少し難しい場合があります。最近の記事/投稿であれば一時的なプラスの影響があると思いますが、自分のサイトはかなり確信していますそれなしではより良いでしょう(しかし、Google検索者はそれなしではより良くないかもしれません!)

Googleで制御するオプションはなく、独自の方法でのみ制御できます。次のいずれかが可能です。

  • 日付を動的に生成された画像に置き換えて、Googleが発見するのを止めようとしますが、これにより、視覚的な配置/一貫したフォント表示/アクセシビリティなどの他の問題が発生する可能性があります。
  • ページからすべての日付を削除します(関連する情報がある場合、訪問者/ユーザーがソースの年齢を知りたい場合、これもまたイライラするかもしれません)。

これらの理由により、私はそれを無視します。

1
Tom Gullen

GoogleのJonh Mueller氏によると:

さまざまな信号を使用して、表示する日付を決定します。または、日付をまったく表示することに意味があるかどうかを判断します。 1つの特定の属性に関連付けられていません。

John Mueller-Twitter

ただし、Googleは次の場所でWebページの日付を検索する可能性が最も高いと思います。

  • 機械学習を使用して、ページ上で一目でわかります
  • Schema.org構造化データ。特に、データがページ上でわかりやすい場所にある場合