web-dev-qa-db-ja.com

ページ上のリンクがインデックスに登録され、フォローされないようにする

クローラー/インデックス作成に対するnofollow値の影響についてpostを読みました。ただし、投稿の回答の情報は2012年に終了します。

私の場合、Googleによってインデックスが作成されたファイルページがあります。ただし、このページにはダウンロードリンクがあります(末尾は?downloadです)。リンクもインデックスであるかどうかはわかりませんが、これを本当に知りたいです:ページ上のリンクがインデックスに登録されていないことを確認するにはどうすればよいですか?

Robots.txtファイルを使用して、このようなものを渡しますか? -

Disallow: /*?download$

または、ダウンロードリンクにrel="nofollow"を配置するだけですか?

また、既にインデックスが作成されている可能性のあるダウンロードリンクについてはどうすればよいですか?

ありがとう!

UPDATE:

Googleのnofollowdocsによると:

一般的に、私たちはそれらに従いません。つまり、Googleはこれらのリンクを介してPageRankやアンカーテキストを転送しません。基本的に、nofollowを使用すると、Webの全体的なグラフからターゲットリンクが削除されます。ただし、nofollowを使用せずに他のサイトがリンクしている場合、またはURLがサイトマップでGoogleに送信されている場合、ターゲットページは引き続きインデックスに表示される場合があります。

したがって、"ページがまだインデックスに表示される可能性がある"は、nofollowを使用するリンクは通常、インデックスに登録されていないことを示していると考えられます。

そういうことで解決すると思いますが、これを裏付ける追加情報があれば、歓迎します。

3
lesssugar

リンクがインデックスに登録されないようにしたい場合は、次のように極端に進むことができます。

  1. サーバー側のスクリプト言語を使用している場合、または十分なApacheアクセスがある場合は、コードを修正して、インデックスを作成しないページにHTTP 410ステータスコードが添付されるようにします。これにより、以前のページがGoogleのインデックスから効果的に削除されます。

  2. <head></head>の間のHTMLに<meta name="ROBOTS" content="NOINDEX,NOFOLLOW">を追加して、ページにインデックスを付けないようロボットに指示します。

将来作成する秘密のページについては、フォームを作成することをお勧めしますが、GETではなくPOSTのメソッドと、次のタイプのコードを使用します。

<form method="POST" action="http://example.com/path/to/secret">
  <input type="submit" value="button label">
</form>

このようにして、スクリプトを使用して、ユーザーがその秘密URLにアクセスして、アドレスバーに手動で入力することを防ぐことができます。

2
Mike

Googleが実際のリンクを発見できないようにするものは、世界のどこにもありません。

http://example.com/page?download robots.txtでのクロールを閉じても、noindexでダウンロードページのインデックスを解除し、nofollowでリンクをマークアップします-これで十分です http://example.com/page?download への単一の受信バックリンクを取得すると、ページがクロールされます。

それがリンクの代わりに良いボタンを使用する理由です

<form method="get" action="file.exe">
  <button type="submit">Download</button>
</form>
1
Evgeniy

他のブログや製品の記事へのリンクなど、ページ内の外部リンクには「rel = "nofollow」を使用する必要があります。

また、内部ページにはrobots.txtでDisallowを使用します。

0
knif3r