C++のhash_map
およびmap
に関して質問があります。 map
はSTLにありますが、hash_map
は標準ではないことを理解しています。 2つの違いは何ですか?
それらは非常に異なる方法で実装されます。
hash_map
(TR1およびBoostではunordered_map
;代わりに使用)は、キーがテーブルのスロットにハッシュされ、値がそのキーに関連付けられたリストに格納されるハッシュテーブルを使用します。
map
は、バランスの取れたバイナリ検索ツリー(通常は赤/黒ツリー)として実装されます。
unordered_map
は、コレクションの既知の要素にアクセスするためのパフォーマンスをわずかに向上させる必要がありますが、map
には追加の有用な特性があります(たとえば、ソート順で格納され、最初から最後までトラバースできます)。 unordered_map
は、map
よりも挿入および削除の方が高速です。
hash_map
は、多くのライブラリ実装によって提供される一般的な拡張機能でした。それがまさに、TR1の一部としてC++標準に追加されたときにunordered_map
に名前が変更された理由です。 mapは通常、赤黒木のようなバランスの取れた二分木で実装されます(実装はもちろん異なります)。 hash_map
およびunordered_map
は通常、ハッシュテーブルで実装されます。したがって、順序は維持されません。 unordered_map
insert/delete/queryはO(1)(一定時間)になります。マップはO(log n)になります。nはデータ構造内のアイテムの数です。したがって、unordered_map
はより高速であり、項目の順序を気にしない場合は、map
よりも優先する必要があります。順序を維持したい場合があります(キーで順序付けされます)。そのためには、map
が選択されます。
主な違いのいくつかは、複雑さの要件にあります。
map
は、挿入および検索操作にO(log(N))
時間を必要とします。これはRed-Black Treeデータ構造として実装されているためです。
unordered_map
は、挿入と検索にO(1)
の '平均'時間を必要としますが、O(N)
のワーストケース時間を許可されています。これは、ハッシュテーブルデータ構造を使用して実装されているためです。
したがって、通常、unordered_map
は高速になりますが、キーと保存するハッシュ関数によっては、さらに悪化する可能性があります。
C++仕様では、STLコンテナにどのアルゴリズムを使用する必要があるかについて正確には述べていません。ただし、パフォーマンスに一定の制約を課しているため、map
およびその他の連想コンテナ用のハッシュテーブルの使用が除外されています。 (最も一般的には、赤/黒ツリーで実装されます。)これらの制約は、ハッシュテーブルが提供できるよりも優れた最悪の場合のこれらのコンテナーのパフォーマンスを必要とします。
ただし、多くの人がハッシュテーブルを本当に必要としているため、ハッシュベースのSTL連想コンテナは長年にわたって一般的な拡張機能でした。その結果、彼らはunordered_map
などを後のバージョンのC++標準に追加しました。
map
はbalanced binary search tree
(通常はrb_tree
)から実装されます。これは、balanced binary search tree
内のすべてのメンバーが並べ替えられるため、マップも同様です。
hash_map
はhashtable
から実装されます。hashtable
のすべてのメンバーはソートされていないため、hash_map(unordered_map)
のメンバーはソートされません。
hash_map
はc ++標準ライブラリではありませんが、今ではunordered_map
(名前を変更すると考えることができます)に名前が変更され、c ++ 11でこの質問が表示されるため、c ++標準ライブラリになります hash_mapの違いおよびunordered_map? .
以下に、2つのタイプマップの実装方法のソースコードからのコアインターフェイスを示します。
以下のコードは、マップがbalanced binary search tree
の単なるラッパーであり、その機能のほとんどすべてがbalanced binary search tree
関数を呼び出すだけであることを示すためのものです。
template <typename Key, typename Value, class Compare = std::less<Key>>
class map{
// used for rb_tree to sort
typedef Key key_type;
// rb_tree node value
typedef std::pair<key_type, value_type> value_type;
typedef Compare key_compare;
// as to map, Key is used for sort, Value used for store value
typedef rb_tree<key_type, value_type, key_compare> rep_type;
// the only member value of map (it's rb_tree)
rep_type t;
};
// one construct function
template<typename InputIterator>
map(InputIterator first, InputIterator last):t(Compare()){
// use rb_tree to insert value(just insert unique value)
t.insert_unique(first, last);
}
// insert function, just use tb_tree insert_unique function
//and only insert unique value
//rb_tree insertion time is : log(n)+rebalance
// so map's insertion time is also : log(n)+rebalance
typedef typename rep_type::const_iterator iterator;
std::pair<iterator, bool> insert(const value_type& v){
return t.insert_unique(v);
};
hash_map
:hash_map
は、構造が次のようなhashtable
から実装されます。
以下のコードでは、hashtable
の主要部分を指定し、hash_map
を指定します。
// used for node list
template<typename T>
struct __hashtable_node{
T val;
__hashtable_node* next;
};
template<typename Key, typename Value, typename HashFun>
class hashtable{
public:
typedef size_t size_type;
typedef HashFun hasher;
typedef Value value_type;
typedef Key key_type;
public:
typedef __hashtable_node<value_type> node;
// member data is buckets array(node* array)
std::vector<node*> buckets;
size_type num_elements;
public:
// insert only unique value
std::pair<iterator, bool> insert_unique(const value_type& obj);
};
map's
のみのメンバーはrb_tree
のように、hash_map's
のみのメンバーはhashtable
です。以下のようなメインコードです。
template<typename Key, typename Value, class HashFun = std::hash<Key>>
class hash_map{
private:
typedef hashtable<Key, Value, HashFun> ht;
// member data is hash_table
ht rep;
public:
// 100 buckets by default
// it may not be 100(in this just for simplify)
hash_map():rep(100){};
// like the above map's insert function just invoke rb_tree unique function
// hash_map, insert function just invoke hashtable's unique insert function
std::pair<iterator, bool> insert(const Value& v){
return t.insert_unique(v);
};
};
以下の画像は、hash_mapに53個のバケットがあり、いくつかの値を挿入するときの内部構造を示しています。
以下の画像は、mapとhash_map(unordered_map)の違いを示しています。画像は mapとunordered_mapを選択する方法? :
何が得られるのかわかりませんが、hash_mapは、150Kの符号なし整数キーとfloat値をclear()するのに20秒以上かかります。私はただ他の人のコードを実行して読んでいます。
これがhash_mapを含む方法です。
#include "StdAfx.h"
#include <hash_map>
ここでこれを読みます https://bytes.com/topic/c/answers/570079-perfomance-clear-vs-swap
clear()はO(N)の順序であると言っています。私にはそれは非常に奇妙ですが、それはそうです。