Réponses:
Ils sont mis en œuvre de manière très différente.
hash_map
( unordered_map
dans TR1 et Boost; utilisez-les à la place) utilisez une table de hachage où la clé est hachée dans un emplacement de la table et la valeur est stockée dans une liste liée à cette clé.
map
est implémenté comme un arbre de recherche binaire équilibré (généralement un arbre rouge / noir).
An unordered_map
devrait donner des performances légèrement meilleures pour accéder aux éléments connus de la collection, mais a map
aura des caractéristiques supplémentaires utiles (par exemple, il est stocké dans un ordre trié, ce qui permet une traversée du début à la fin). unordered_map
sera plus rapide lors de l'insertion et de la suppression qu'un fichier map
.
hash_map
était une extension courante fournie par de nombreuses implémentations de bibliothèques. C'est exactement pourquoi il a été renommé unordered_map
lorsqu'il a été ajouté au standard C ++ dans le cadre de TR1. map est généralement implémentée avec un arbre binaire équilibré comme un arbre rouge-noir (les implémentations varient bien sûr). hash_map
et unordered_map
sont généralement implémentés avec des tables de hachage. Ainsi l'ordre n'est pas maintenu. unordered_map
insert / delete / query sera O (1) (temps constant) où la carte sera O (log n) où n est le nombre d'éléments dans la structure de données. C'est donc unordered_map
plus rapide, et si vous ne vous souciez pas de l'ordre des articles, il faut préférer map
. Parfois, vous voulez maintenir l'ordre (ordonné par la clé) et pour cela map
serait le choix.
Certaines des principales différences résident dans les exigences de complexité.
A map
nécessite du O(log(N))
temps pour les opérations d'insertion et de recherche, car il est implémenté sous la forme d'une structure de données d' arbre rouge-noir .
An unordered_map
requiert un temps «moyen» de O(1)
pour les insertions et les découvertes, mais il est autorisé à avoir un temps dans le pire des cas de O(N)
. En effet, il est implémenté à l'aide de la structure de données de table de hachage .
Donc, généralement, unordered_map
sera plus rapide, mais en fonction des touches et de la fonction de hachage que vous stockez, cela peut devenir bien pire.
La spécification C ++ ne dit pas exactement quel algorithme vous devez utiliser pour les conteneurs STL. Elle impose cependant certaines contraintes sur leurs performances, ce qui exclut l'utilisation de tables de hachage pourmap
et d'autres conteneurs associatifs. (Ils sont le plus souvent implémentés avec des arbres rouges / noirs.) Ces contraintes nécessitent de meilleures performances dans le pire des cas pour ces conteneurs que les tables de hachage peuvent offrir.
Cependant, beaucoup de gens veulent vraiment des tables de hachage, c'est pourquoi les conteneurs associatifs STL basés sur le hachage sont une extension courante depuis des années. Par conséquent, ils ont ajouté unordered_map
et ainsi de suite aux versions ultérieures de la norme C ++.
map
est généralement qu'un arbre équilibré était dû à l'utilisation operator<()
comme moyen de déterminer l'emplacement.
map
est implémenté à partir de balanced binary search tree
(généralement a rb_tree
), puisque tous les membres balanced binary search tree
sont triés, ainsi que la carte;
hash_map
est implémenté à partir de hashtable
.Comme tous hashtable
les membres de hash_map(unordered_map)
ne sont pas triés, les membres de ne sont pas triés.
hash_map
n'est pas une bibliothèque standard C ++, mais maintenant elle a été renommée unordered_map
(vous pouvez penser qu'elle a été renommée) et devient une bibliothèque standard C ++ depuis C ++ 11 voir cette question Différence entre hash_map et unordered_map?pour plus de détails.
Ci-dessous, je vais donner une interface de base à partir du code source de la façon dont la carte à deux types est implémentée.
Le code ci-dessous est juste pour montrer que la carte est juste un wrapper d'une fonction balanced binary search tree
, presque toute sa fonction est simplement d'invoquer la balanced binary search tree
fonction.
template <typename Key, typename Value, class Compare = std::less<Key>>
class map{
// used for rb_tree to sort
typedef Key key_type;
// rb_tree node value
typedef std::pair<key_type, value_type> value_type;
typedef Compare key_compare;
// as to map, Key is used for sort, Value used for store value
typedef rb_tree<key_type, value_type, key_compare> rep_type;
// the only member value of map (it's rb_tree)
rep_type t;
};
// one construct function
template<typename InputIterator>
map(InputIterator first, InputIterator last):t(Compare()){
// use rb_tree to insert value(just insert unique value)
t.insert_unique(first, last);
}
// insert function, just use tb_tree insert_unique function
//and only insert unique value
//rb_tree insertion time is : log(n)+rebalance
// so map's insertion time is also : log(n)+rebalance
typedef typename rep_type::const_iterator iterator;
std::pair<iterator, bool> insert(const value_type& v){
return t.insert_unique(v);
};
hash_map
:hash_map
est implémenté à partir de hashtable
laquelle la structure est un peu comme ceci:
Dans le code ci-dessous, je vais donner la partie principale de hashtable
, puis je donne hash_map
.
// used for node list
template<typename T>
struct __hashtable_node{
T val;
__hashtable_node* next;
};
template<typename Key, typename Value, typename HashFun>
class hashtable{
public:
typedef size_t size_type;
typedef HashFun hasher;
typedef Value value_type;
typedef Key key_type;
public:
typedef __hashtable_node<value_type> node;
// member data is buckets array(node* array)
std::vector<node*> buckets;
size_type num_elements;
public:
// insert only unique value
std::pair<iterator, bool> insert_unique(const value_type& obj);
};
Comme map's
seul membre est rb_tree
, le hash_map's
seul membre est hashtable
. C'est le code principal comme ci-dessous:
template<typename Key, typename Value, class HashFun = std::hash<Key>>
class hash_map{
private:
typedef hashtable<Key, Value, HashFun> ht;
// member data is hash_table
ht rep;
public:
// 100 buckets by default
// it may not be 100(in this just for simplify)
hash_map():rep(100){};
// like the above map's insert function just invoke rb_tree unique function
// hash_map, insert function just invoke hashtable's unique insert function
std::pair<iterator, bool> insert(const Value& v){
return t.insert_unique(v);
};
};
L'image ci-dessous montre quand un hash_map a 53 buckets et insère des valeurs, c'est sa structure interne.
L'image ci-dessous montre une certaine différence entre map et hash_map (unordered_map), l'image vient de Comment choisir entre map et unordered_map? :
Je ne sais pas ce que cela donne, mais hash_map prend plus de 20 secondes pour effacer () 150K clés entières non signées et valeurs flottantes. Je suis juste en train d'exécuter et de lire le code de quelqu'un d'autre.
C'est ainsi qu'il inclut hash_map.
#include "StdAfx.h"
#include <hash_map>
J'ai lu ceci ici https://bytes.com/topic/c/answers/570079-perfomance-clear-vs-swap
dire que clear () est l'ordre de O (N). Cela pour moi, c'est très étrange, mais c'est comme ça.