キー値に基づく値の範囲

Question

特定の範囲に一致する2Dポイントを大量に検索する方法を実装しようとしています。 <X, Point>および<Y, Point>のHashMapを作成することを考えていますが、x_minからx_maxおよびy_minまでの値に基づいて範囲内のポイントを取得するので、これを行うにはHashMapが適していると思いますy_maxに。

したがって、基本的には<X,Point>からx_minからx_maxまでのすべてのポイントを取得し、<Y,Point>からy_minからy_maxまでのポイントと比較します...

HashMap<Integer,Point> x_coordinates = new HashMap<Integer,Point>(); for(int i=x_min;i<=x_max;i++){ if(x_coordinates.containsKey(i)) x_coordinates.get(i); } HashMap<Integer,Point> y_coordinates = new HashMap<Integer,Point>(); for(int i=y_min;i<=y_max;i++){ if(y_coordinates.containsKey(i)) y_coordinates.get(i); }

HashMapや他のタイプのデータ構造から値の範囲を取得するより速い方法はありますか？

たとえば、範囲= 200の場合、x-200からx + 200およびy-200からy + 200の範囲に一致するすべてのポイントを選択します

私はすべてのポイントの反復を回避しようとしていますが、問題のポイントが広い領域に散らばっているので、巨大な2D行列を作成することも避けたいです。

いくつかのテストの後、MichaelTの回答に基づいて、次のコードを記述しました。

TreeMap<Integer, TreeMap<Integer, Integer>> values; for (int x : values.subMap(x_min, x_max).keySet()) { for (int y : values.get(x).subMap(y_min, y_max).values()) { // y here, represents the values of points in range... } }

user40980 · Accepted Answer

あなたが説明しているのは、範囲選択を行いたい疎行列です。

最初は、HashMapもLinkedHashMapもあなたが望んでいることを最適に行うことはできません。これがHashMapの範囲内の要素を見つける理由は、順序付けられていないリストO（n）を効率的に歩くためです。 LinkedHashMapは、ひどいifよりもわずかに最適である可能性があります。その後、新しいものは追加されません。 O(n)の代わりに、O(n/m)を取得しているため、これはまだ最適なアプローチではありません。範囲を過ぎる）これはまだ実質的にO（n）です。LinkedHashMapリストでバイナリ検索を実行することはできません。

それでは、他のいくつかの構造を見てみましょう。あなたが本当にの後は SortedMap インターフェースです。 SortedMap subMap（K fromKey、K toKey）を使用して、サブマップをあるキーから別のキーにすばやく引き出すことができます。それらのクラスのいずれかを選択すると、あなたはあなたが求めているものを手に入れるでしょう。

次に、各サブマップの values を取得し、あるセットを他のセットに対して boolean retainAll（Collection c）を実行します。

それは簡単な答えです。これは、スパース行列のリストのリストアプローチです。ただし、より直接的なサブ範囲オプションを提供する他の形式でマトリックスをエンコードすることもできます。これは、Java標準ライブラリの一部ではありません。その場合、独自の実装を作成するために this path にダウンする可能性があります。

将来的に可能性が発生する可能性がある場合は、スパースマトリックス用の独自のインターフェイスを作成し、その背後にあるルックアップを実行するクラスを実装することを検討する必要がありますあなたが欲しい。このようにして、後で何らかの理由で実装を変更する必要があると判断した場合、別の構造を処理するようにすべてのコードを変更するのではなく、実装（他のものをラップする新しいクラス）を変更するだけです。

Jules · Answer

ツリーマップのツリーマップに基づくソリューションは機能し、最初に使用したハッシュマップソリューションよりもはるかに優れていますが、ツリーマップに似た構造であるが、ペアのキーとしてだけでなく、キーとして調整します。これにより、長方形の範囲をそれらから選択することが特に効率的になります。 Javaで利用可能な多くの実装があり、クイックグーグルで見つけることができます。

mgoeminne · Answer

k-d tree を確認する必要があります。この構造は、通常、「このポイントは存在しますか？」、「最寄りの郵便局はどこですか？」、「30歳から40歳までの従業員は誰ですか？

したがって、問題は、この構造が特に適している典型的な範囲検索問題です。 Wikipediaによると、この構造での問題の最悪の場合の時間はO（kN ^（1 1/k））です。ここで、kは次元の数（2）で、Nは数です。ツリー内のノードの。

ただし、いくつかの制限があります。

K-dツリーの作成には時間がかかります。バランスの取れたツリーを取得するには「中央」点を決定する必要があるためです。つまり、ポイントを順序付けする必要があります。分割平面の基準として中央値を使用しないことを決定できますが、不均衡なツリーが得られ、効率が低下します。トレードオフとして、非常に悪い選択を避けるために、ポイントのサブセットから中央値を選択できます。

ポイントを追加または削除する必要がある場合は、log n時間で実行できます。ただし、これらの操作はツリーのバランスを崩す可能性が高いため、再バランスのために余分な時間を費やさない限り、パフォーマンスは時間とともに低下します。ポイントを頻繁に追加/削除する必要があり、ディメンションのサイズが固定されている場合は、代わりに---（quadtrees を検討できます。

私はそれを使用したことがありませんが、明らかに Java ML にはk-dツリーの適切な実装があります。