web-dev-qa-db-ja.com

Youtubeコメントシステムのソート/ランキングアルゴリズムとは何ですか?

Youtubeには、2つの並べ替えオプションがあります。 「新しい順」は、コメントを投稿日で並べ替えるだけの簡単なものです。ただし、「上位のコメント」は、「評価」で並べ替えるよりもはるかに複雑なようです。

Youtube comment system

短い調査の結果、コメントの順序はそれらに依存することがわかりました。

  • 「いいね」と「いいね」の数
  • 投稿日
  • そのコメントへの返信数

しかし、どの情報がより重要で何が重要ではないかなど、YouTubeがこの情報を使用して順序を決定する方法はわかりません。

このトピックについて私が参照できる記事はありますか?

ありがとう!

20
TrungDQ

私はあなたの質問に対する答えを持っています。

これに対する答えをインターネットで検索した後、私は探していたものを正確に見つけることができませんでした。そこで、私と同僚は、YouTubeのコメント付きのシステムを使って実験することにしました。

まず、人気のある動画と思われるものを1つのセクションに分類し、平均的な動画を別のセクションに分類し、人気の低い動画を最後のセクションに分類しました。各セクションには200本の動画があり、何日も調べた結果、パターンに気づき始めました。必要な3つの点についてはあなたが正しいとわかりましたが、もう少し深く調べて、追加の変数を見つけました。

YouTubeのコメントシステムは、次の4つの要素に依存しています。

1)投稿された時間

2)コメントの高評価/低評価の比率、

3)返信数、

4)そして、信じられないかもしれませんが、WHOが投稿しました。

あなたがこれまでに投稿したすべてのパブリックコメントの平均の高評価/低評価の比率がそれに組み込まれます/嫌いな比率は、多くの人が好きではない、または単に同意しないコメントを投稿します。

それにはアルゴリズムがあり、あなたが思っているよりもかなり簡単です。基本的には「モジュールポイント」と呼ばれるものがあり、これら4つの要素に基づいて特定のものが得られます。まず、2つの要素を使用したモジュールポイント変換について知っておくべきことを次に示します。

  • コメントの高評価/低評価の比率については、その数に10を掛けます。

  • コメントの返信数(元の投稿者からではない)については、2つのモジュールポイントがあります。

これらは、コメントが持つモジュールポイントの量を示す2つの基本的な要素です。

たとえば、コメントに27の高評価と8の低評価がある場合、比率は3.375になります。 10を掛けると、33.75モジュールポイントになります。次の要素である返信の量を使用して、このコメントに4つの直接返信があるとします。 2を4で乗算すると、8になります。これは、8を累積モジュールポイントに追加する部分で、合計41.75モジュールポイントになります。

しかし、ここでは完了していません。ここがトリッキーになります。

人がこれまでに公開したコメントの合計の平均の高低の比率を使用して、累積モジュールポイントに追加された式は次のとおりであることがわかりました。

C = MP(R/3) + (MP/10)

_where C = Comment Position Variable; MP = Module Points; R = Person's total like/dislike ratio_

私を信じて、私たちはこの部分だけにDAYSを費やしています。この方程式内の3と10はランダムで不必要に見えますが、これまでにこの方程式をテストしたすべてのコメントはテストに合格しましたが、これらの2つの変数が削除されたときにテストに合格しませんでした。この方程式が完了すると、Position Variableという名前の番号が得られます。

しかし、まだ終わっていません。timeについてはまだ話していません。

この部分が思ったほど長くはかからなかったのに実際にはかなり驚きましたが、テストしたすべてのコメントに対して毎回この式を実行するのは確かに面倒でした。最初にそれをテストしたとき、2つのコメントの位置変数が等しい場合、障壁を打破するための時間がそこにあることがわかりました。

実際、これが起こったとき、私はそれを実験のラップと呼んでいましたが、さらに調べると、やるべきことがまだあることがわかりました。同じ位置変数を持つコメントのいくつかが互いに上回っていたことがわかりましたが、タイミングがランダムに見えました!数日間の検査の後、ここで最終結果が得られます。

4番目の変数を適用する前に見つけなければならない別の方程式がまだあります。別の別の方程式を使用して、ここに代数的演繹が下されたものです:

X = 1/3(S/10 + A) x [absolute value of](A - 3S)

_where X = Timing Variable; S = How long ago the video was posted in minutes; A = How long ago the comment was posted in minutes_

これを作っていたらよかったのですが、残念ながらこれはシステムがいかに複雑かです。他の変数の背後には数学的な理由がありますが、それらは説明するには複雑すぎるため、おそらく説明するのに少なくとも3パラグラフかかるでしょう。 150以上のコメントでこの方程式をテストしましたが、それらはすべて真実であることが確認されています。

タイミング変数と呼ばれるXを見つけたら、ここからそれをこの方程式に適用するだけです。

N = X(C/4 + 1)

_where X = Timing Variable; C = Positioning Variable_

[〜#〜] n [〜#〜]は、すべての問題に対する答えです。

これが最終的な方程式であり、最終的な答えです。簡単な結論:Nが高いほど、コメントは高くなります。

注:同僚、David Mattison、Josh Williams、Diego Mendieta、Steven Orsette、Kyle Shropshireに特に感謝します。私は彼らなしではこれを見つけることができなかったでしょう、そして彼らがこれに入れた仕事。

35
Cole Dixon