有毒リンクとは何ですか？

Question

数か月前に同様の質問をしましたいつ良いリンクが有毒になるのでしょうか？ですが、今回は "what有毒リンクですか？」。インターネット上で、実際に有毒リンクとして分類される情報がほとんどないため、有毒リンクを否認する必要があることを読んでいます。

悲しいことに、ほとんどの情報は、実際にはこれが実際に悪いアドバイスになる可能性があるのに、それらが自己作成されているという理由だけで有毒リンクを分類します。ソーシャルネットワーク、GitHub、WordPressプラグインディレクトリ、スタートアップサイト、一部のインフォグラフィック、引用などのリンクは、一般に自己作成されるため、削除しないでください。いくつかのアドバイスには、「nofollowed」ではないリンクのみを気にするペンギンが含まれ、残りは無視されます（最も尊敬されているSEOの一部はこれを言っています）。

他のリンクには、ブランドまたはビジネス名を使用して関連性の高いブログへのブログコメントを含めることができます。これにより、関連性が向上し、ユーザーエクスペリエンスが向上します。それで...この質問のアイデアは、あなたが読んだものとあなたが学んだものに基づいて質の高い答えを持ち、この質問を一度確立されたwikiコミュニティの質問に切り替える可能性があるということです。

理想的な答えはやや深めである必要があります。たとえば、ブログのコメントリンクは悪いです。実際の名前を使用してもかまいません。名前フィールドを使用するのは悪いですが、本文は大丈夫です。部分的なキーワードの一致は大丈夫です。悪いなどです。しかし、来週に100,000ワードの回答を書くことに誰も期待しないでください。

closetnoc · Answer

はい。始める。

有毒リンクという用語は、Googleでは使用されていません。これは完全にSEOのチャットクラスの発明であり、一部のユーザーはこの用語を使用してユーザーをサイトに誘導し、ユーザーを脅かし、自分自身の重要性を掘り下げるか、何かを販売しています。

Googleに関する限り、有毒なリンクはありません。もちろん悪いリンクはありますが、実際にペナルティを得ることができるリンクは真空状態では発生しません。実際に行うのは難しいです。

同様に、これは大きなトピックです。 64,000フィートのビューをできるだけ多く表示し、100,000ワードの制限内に収めます。めまいがする場合は、下を見ないでください。眠りに落ちたら、氷水をお勧めします。転倒した場合は、LifeAlertに連絡してください。

これをリバースエンジニアリングして、できる限りGoogleの観点から見ていきます。納屋の周りの長い道のりのように思えるかもしれませんが、実際にはより良い学習体験です。

この答えにはセマンティクスが極めて重要です。

以前に、セマンティクスとリレーショナルペア、およびリレーショナルチェーンについて説明しました。意味関係は理解することが重要です。どうして？ Googleがスパムや不良リンクのトピックについて話すとき、ノード、リンク、クラスターなどの用語を使用してセマンティクスについて話すため、これらの用語で考え、用語などの無関係な用語を割り当てないことを忘れないことが重要です。毒性。コンピュータサイエンスを問題に適用することには、人間の感情的な用語は含まれません。機械のように考えると、はるかに良くなります。それをニックス！私はHal、Bender、および他のいくつかについて考えました。

私は答えの例でセマンティクスについて話しました：なぜGoogleの検索結果にないキーワードスタッフィングのランクが1より高いウェブサイトですか？

この場合、多くの要因が関係しています。ここではそれらをすべて入手しません。実際、私も試してはいません。リストが長すぎます。だから私はあなたに手がかりを与えるだけです。

いつどこでそれが始まり、何で構成されているか。

最初に知っておくべきことは、1997年に最初に発表された研究論文の数年後、2003年以前にGoogleがこのプロセスを開始したことです。2003は、Googleが行ったテーマに関する最初の適用可能なヒントです。また、Googleは手がかりを探しているすべてのWebサイトでできるだけ多くのデータを収集することも知っています。収集されたものはあなたを驚かせるでしょうが、2003年でさえ、登録情報（whois）、ドメイン名レジストラ情報、ホスト情報、DNSを含むDNS情報、ネットワーク、IPアドレスを変更するドメイン名、ドメイン名前はIPアドレスに割り当てられ、マルチホスティングとシングルホスティングが収集されました。この一部として明らかになっているのは、悪いネットワークで知られているネットワーク、低品質ドメインをホストしているレジストラー、低品質ドメインをホストしているWebホスト、低品質の特定のIPアドレス、低品質のIPアドレスブロックです。その後まもなく、Googleはこの分析の一部としてブラックリストデータを使用し、その点で企業を評価するレジストラとホストの技術サポートの品質にも注目しました。本当に。

また、Googleはコンテンツエバリュエーターを使用してWebサイトを手動で確認したことも知っています。このうち、彼らはAI学習方法の種として機能する特定のカテゴリに適合するサイトを探しています。これらのカテゴリには、もちろん、スパム、信頼、信頼できる、信頼できない、人間が生成する、機械が生成するなどがあります。これらのシードサイトは、AI分析の比較に使用されます。

新機能（ish）とは？

Googleは、タイトルタグ、リンク、およびコンテンツにセマンティクスおよびその他の分析を適用していることを知っています。これの1つはn-gramです。 N-gramは、nWordセットのコンテンツを段階的に細分化する簡単な方法です。たとえば、「素早い茶色のキツネは怠dogな犬を飛び越えます。」 3グラムを使用すると、The quick brown、quick brown fox、 茶色のキツネのジャンプなど。その後、nをインクリメントして、分析を再開できます。これを使用してシードサイトと比較すると、Googleはコンテンツの言語を評価し、次のようないくつかのことを判断できます。それは人間によって書かれたのか、機械によって書かれたのか、スピナーが使用されたのか、アメリカ英語と他の言語などのバリエーションを含むコンテンツの言語などです。 Googleは、by linesなどのデータペアを使用して、n-gramを使用して、既知の著者の作品と比較することで、無署名の作品の著者を特定することもできます。すごい。

Googleは巨大なセマンティックデータベースをホストしています。認めた。続けて。

このセマンティックデータベースでは、特定のリンクが作成され、クラスターが形成されます。クラスターは、リレーショナルの類似性またはリンケージを持つエンティティです。明確にするために。

A社には、登録、ホスト、IP、レジストラ、ドメイン名パターン、テンプレート、配色、画像の類似性、コンテンツの類似性、コンテンツの複製、Webベースの連絡先情報（電子メールは特に貴重な手がかり）、人事リスト、アプリケーションプロファイル、リソースプロファイル、リンクパターンなど。以前はレルムという用語を使用していましたが、それは一部のサークルでは正しい用語です。用語クラスタの使用は、セマンティクスの同じ概念です。 A社が所有するすべてのサイト、つまりクラスターです。クラスターは任意の関係にでき、クラスターは互いにオーバーラップできることを理解してください。だから私たちが進むにつれてこれを想像してください。

スパマーは身を任せます。

スパムサイトを知る方法はいくつかあります。コンテンツの類似性、テンプレート、画像の類似性、アプリケーションプロファイル、リソースプロファイル、リンクパターンなどです。そして、そうそう、他の特徴があります。

スパマーサイトには通常、いくつかの共通点があります。 1つはスーパーオーソリティサイトです。どうして？権限がないと、スパムスキーム全体が崩壊して失敗するためです。スーパーオーソリティサイトには、数千のインバウンドリンクと、より少ないアウトバウンドリンクが含まれます。その一環として、2003年には、これまでに見たPageRankの従来のビューがウィンドウから除外されています。各リンクを介してPR 3を通過する他の2つのページにリンクするPR 6ページの図面を見たことを覚えていますか？これは過度に単純化された見方であり、ほぼ完全に間違っています。各リンクは値について評価されます。これには、0を含む実際の値が含まれます。サイト/ページの信頼/権限には上限があり、高い信頼/権限のサイト/ページは、所有する値よりも少ない値で、リンク。なぜこれが行われるのですか？より自然な曲線をスキーマに彫刻し、スーパーオーソリティサイトがあまりにも多くの価値を渡すのを打ち負かすため。これはスパマーの弓を渡る最初の一斉攻撃のようです。

リンクはパターンだけでなく、コンテンツの評価とほぼ同じ方法で評価されます。これにより、Googleはリンクが自然か不自然かを判断できます。リンクスキームは、特に、ほとんどの部分が検出可能な機械で作られていると考える場合、パターンに従います。

小さく考えます。

セマンティクスは、多くの多くの要因をデータベースに保存するために使用されます。データベースを使用して、リンクマップを評価し、クラスターを決定できます。以前は主にドメインに関連するクラスターについて説明しましたが、ページ、リンク、テンプレート、コンテンツ、ナビゲーションリンク、サイドバーなどのより小さなエンティティで考えてください。セマンティックリンクマップを使用して、Googleはパターンを強力に決定できますエンティティのセットが操作可能なように設計されている可能性。クラスタを使用してパターンと関係をリンクすると、この分析の結果として、ペナルティが適用される場合にペナルティが配られます。これを覚えて。

パンダおよびその他のアルゴリズム。

Googleのアルゴリズムを知ることはできませんが、これを知ることはできます。パンダは定期的に実行されます。 Panda 4.2は、サイトの大部分を再取得する必要があるため、遅いのはなぜですか？パンダが通常のアルゴリズムに作り直されていることも知られています。別の回答で、AIはエージェントと呼ばれる小さなコードで記述されていると述べました。通常、エージェントは、一般的にバイナリの1つの質問に回答します。もちろん、これは常に当てはまるわけではありませんが、エージェントは一般に1つの概念的な機能を実行します。また、さまざまなタイプのスコアになりうるメタデータを作成するためにエージェントが使用されることもわかっています。エージェントは互いに依存している場合があり、別のコードで参照してこの依存関係を維持できます。同様に、大規模なデータベースの更新が必要な場合は、複数のエージェントを参照するコードが記述されます。この場合、Pandaはより多くの情報を必要とします。つまり、セマンティックデータベースに追加される新しい要素または既存の要素が更新される可能性が高いことを意味します。同様に、アルゴリズムの値と調整には、セマンティックデータベース内での再計算が必要になる可能性があります。ちなみに、私たちはまた、パンダが他のコードのロールアップである可能性が高いことを知っています。エージェントはこれの重要な部分です。 AIパターンに適合するように見えます。

はい。それで、私たちは何を得ましたか？

Googleは有毒リンクという用語を使用しません。 Googleは、悪いリンク、クラスターなどについて話します。 Googleは信頼と権限を制限し、リンクの実際の価値を評価し、それらに0の値を与えていることを知っています。 Googleは関係や操作性のあるコンテンツ、リンク、サイトなどを見つけるためにあらゆるものを調べることを知っています。この分析の結果としてペナルティが生じることがわかります。

それでは、有毒なリンクとは何ですか？

操作が決定されるクラスターのエンティティの1つからサイトへのアウトバウンドリンク。（息-それは大丈夫-以下。）それはリンク自体やリンクの特性ではなく、リンクがあなたをGoogleにとって関心のあるクラスターに引き込むという事実です。

これは、ジャンクサイトリンクが有毒であることを意味しますか？

いいえ。多くのサイトにリンクし、それ自体の多くのインバウンドリンクさえ持つことができる大きなサイトは、一般にペナルティを受けるに値しないことを覚えておいてください。これ自体はスパムではありません。サイトです。 domaintools.comを考えてください。パターンに適合しますが、ペナルティに値する場所はありません。このようなサイトには多くの例があります。ペナルティが発生するためには、どこかで操作の大まかな例が必要です。

概要

これは、リンク自体ではなく、リンクの構成や配置ではなく、関心のあるリンクのソースであることを示すための単なる説明です。一般的に、お粗末なサイトからの粗末なリンクは害を与えません。それ以外のことを述べることは、恐ろしい戦術であるか、または単に間違っています。実際、十分な粗悪なサイトからの十分な粗悪なリンクは、ターゲットサイトのパフォーマンスを驚くほどよくするのに役立ちます（もちろん推奨しません-はい、例があります）。私が定義したような単一の有毒なリンクでさえ、おそらくあなたを傷つけることはないでしょう。問題となっているのは、1つまたは複数のクラスターからの有毒リンクのパターンです。彼らは潜在的にあなたをクラスターに引き込む可能性があり、それらが罰せられると、あなたのサイトが含まれる可能性が高くなる可能性があります。

100,000語ではなく、SEが制限する40,000文字以内である可能性があります

Simon Hayter · Answer

これを開始します...

関連フォーラムの署名

正確なキーワード-有毒
部分的なキーワード-高リスク
部分的な会社名-中リスク
一意の会社名のアンカーテキスト-中リスク
ブランド名-中リスク
あなたの名前-低リスク
Imgリンク-低リスク
http：//リンク-低リスク
Img srcリンクなし-リスクなし
ドメイン/ブランド/名前/ビジネス名の言及-リスクなし