web-dev-qa-db-ja.com

1次元データを最適にクラスター化しますか?

Ckmeans.1d.dp アルゴリズムがどのように機能するかを説明した論文を誰かが持っていますか?

または:1次元でk平均クラスタリングを行う最も最適な方法は何ですか?

29
Laciel

単変量k平均クラスタリングは、Monge行列の理論結果に基づいてO(kn)時間(既に並べ替えられた入力))で解決できますが、このアプローチは、数値の不安定性とまた、おそらくコーディングの課題です。

より良いオプションは、O(knlgn)メソッド)です。このメソッドは、現在Ckmeans.1d.dpバージョン3.4.6で実装されています。この実装は、ヒューリスティックk平均と同じくらい高速ですが、最適性、次数が保証されています特に大きなkの場合、ヒューリスティックk平均よりも規模が大きくなります。

Richard Bellman(1973)による一般的な動的プログラミングソリューションは、k-means問題の詳細に触れておらず、暗黙のランタイムはO(kn ^ 3)です。

2
user6417312