首页 > 其他分享 >unordered系列容器的实现

unordered系列容器的实现

时间:2024-09-01 18:23:52浏览次数:14  
标签:容器 return tables hashi kv const root unordered 系列

1. unordered_set与unordered_map的结构

我们知道STL中的unordered_setunordered_map底层就是一个开散列的哈希表

1.1 unordered_set的结构

我们知道unordered_set其实就是K模型,所以unordered_set容器对红黑树的封装如下:

	template<class k, class Hash = Hashfunc<k>>
	class unordered_set
	{
		struct SetKeyofT
		{
			const k& operator()(const k& key)
			{
				return key;
			}
		};

	public:

    private:
		HashTable<k, const k, SetKeyofT, Hash> _t;
	};

由于unordered_set 和 unordered_map 底层都是哈希表,所以我们需要传一个仿函数来方便后期比较key值

1.2 unordered_map的结构

我们也知道unordered_map其实就是KV模型,所以unordered_map容器对红黑树的封装如下:

	template<class k, class T, class Hash = Hashfunc<k>>
	class unordered_map
	{
		struct MapKeyofT
		{
			const k& operator()(const pair<k, T>& key)
			{
				return key.first;
			}
		};
	public:

	private:
		HashTable<k, pair<const k, T>, MapKeyofT, Hash> _t;
	};

其中为了防止K值被修改,我们都加上const修饰。

2. 改造哈希表

2.1. 模板参数列表的改造

  • K:关键码类型
  • T: 不同容器T的类型不同,如果是unordered_map,T代表一个键值对,如果是unordered_set,T为 K
  • KeyofT: 因为T的类型不同,通过value取key的方式就不同,详细见unordered_map/set的实现
  • Hash: 哈希函数仿函数对象类型,哈希函数使用除留余数法,需要将Key转换为整形数字才能取模
    //哈希表的节点
	template<class T>
	struct HashNode
	{
		T _kv;
		HashNode<T>* _next;

		HashNode(const T& kv)
			: _kv(kv)
			,_next(nullptr)
		{ }
	};

    template<class k, class T, class KeyofT, class Hash>
    class HashTable

2.2. 增加迭代器操作

注意:因为哈希桶在底层是单链表结构,所以哈希桶的迭代器不需要--操作

	//为了实现简单,在哈希桶的迭代器类中需要用到 hashtable本身
    template<class k, class T, class KeyofT, class Hash>
	class HashTable;

	template<class k, class T, class ref, class ptr, class KeyofT, class Hash>
	class IteratorHash
	{
		typedef HashNode<T> Node;
		typedef IteratorHash<k, T, ref, ptr, KeyofT, Hash> self;

		Node* _node;
		const HashTable<k, T, KeyofT, Hash>* _tbptr;
	public:
		IteratorHash(Node* node, const HashTable<k, T, KeyofT, Hash>* tbptr)
			:_node(node)
			,_tbptr(tbptr)
		{ }


		ref operator*()
		{
			return _node->_kv;
		}

		ptr operator->()
		{
			return &_node->_kv;
		}

		bool operator!=(self& s)
		{
			return s._node != _node;
		}

		self& operator++()
		{
			if (_node->_next != nullptr)
			{
				_node = _node->_next;
			}
			else
			{
				KeyofT kot;
				Hash ht;
				size_t hashi = ht(kot(_node->_kv)) % _tbptr->_tables.size();
				hashi++;
				while (hashi < _tbptr->_tables.size() && _tbptr->_tables[hashi] == nullptr)
				{
					hashi++;
				}
				if (hashi == _tbptr->_tables.size())
				{
					_node = nullptr;
				}
				else
				{
					_node = _tbptr->_tables[hashi];
				}
			}
			return *this;
		}

	};

Find函数

		Iterator Find(const k& key)
		{
			Hash hot;
			KeyofT kot;
			int hashi = hot(key) % _tables.size();
			Node* root = _tables[hashi];
			while (root)
			{
				if (kot(root->_kv) == key)
				{
					return Iterator(root, this);
				}
				root = root->_next;
			}
			return Iterator(nullptr, this);
		}

在哈希表中的哈希函数一般都需要进行取模操作,但是有些自定义类型如string就无法直接进行取模操作,这时我们就需要通过某种方法将string转化为整型,然后再带入哈希函数求对应的下标。但遗憾的是,我们无法找到一种能实现字符串和整型之间一对一转换的方法,因为在计算机中,整型的大小是有限的,比如用无符号整型能存储的最大数字是4294967295,但是不同字符串能组合的数字是无限的,以无限对有限,这就意味着无论哪种哈希函数都可能存在哈希冲突。

所以我们可以针对string类型写一个特化版本。 

template<class k>
struct Hashfunc
{
	size_t operator()(const k& _kv)
	{

		return (size_t)_kv;
	}
};

template<>
struct Hashfunc<string>
{
	size_t operator()(const string& _kv)
	{
		size_t a = 0;
		for (auto e : _kv)
		{
			a += e;
			a *= 31;
		}
		return a;
	}
};

 

	template<class k, class Hash = Hashfunc<k>>
	class unordered_...
    {

   	};

Insert函数

		pair<Iterator, bool> Insert(const T& kv)
		{
			Hash hot;
			KeyofT kot;
			if (_n == _tables.size())
			{
				vector<Node*> _newtables(_tables.size() * 2, nullptr);
				for (size_t i = 0; i < _tables.size(); i++)
				{
					while(_tables[i])
					{
						Node* root = _tables[i]->_next;
						int hashi = hot(kot(_tables[i]->_kv)) % (_tables.size()*2);
						_tables[i]->_next = _newtables[hashi];
						_newtables[hashi] = _tables[i];
						_tables[i] = root;
					}
				}
				_tables.swap(_newtables);
			}
			int hashi = hot(kot(kv)) % _tables.size();
			Node* root = _tables[hashi];
			_tables[hashi] = new Node(kv);
			_tables[hashi]->_next = root;
			_n++;
			return { Iterator(_tables[hashi], this), true};
		}

Erase函数

		bool Erase(const k& key)
		{
			Hash hot;
			KeyofT kot;
			int hashi = hot(key) % _tables.size();
			Node* root = _tables[hashi];
			Node* prev = nullptr;
			while (root)
			{
				if (kot(root->_kv) == key)
				{
					if (prev == nullptr)
					{
						_tables[hashi] = root->_next;
					}
					else
					{
						prev->_next = root->_next;
					}
					delete root;
					_n--;
					return true;
				}
				prev = root;
				root = root->_next;
			}
			return false;
		}

3.整体代码如下

Hashtable:

template<class k>
struct Hashfunc
{
	size_t operator()(const k& _kv)
	{

		return (size_t)_kv;
	}
};

template<>
struct Hashfunc<string>
{
	size_t operator()(const string& _kv)
	{
		size_t a = 0;
		for (auto e : _kv)
		{
			a += e;
			a *= 31;
		}
		return a;
	}
};

namespace bit
{

	template<class T>
	struct HashNode
	{
		T _kv;
		HashNode<T>* _next;

		HashNode(const T& kv)
			: _kv(kv)
			,_next(nullptr)
		{ }
	};

	template<class k, class T, class KeyofT, class Hash>
	class HashTable;

	template<class k, class T, class ref, class ptr, class KeyofT, class Hash>
	class IteratorHash
	{
		typedef HashNode<T> Node;
		typedef IteratorHash<k, T, ref, ptr, KeyofT, Hash> self;

		Node* _node;
		const HashTable<k, T, KeyofT, Hash>* _tbptr;
	public:
		IteratorHash(Node* node, const HashTable<k, T, KeyofT, Hash>* tbptr)
			:_node(node)
			,_tbptr(tbptr)
		{ }


		ref operator*()
		{
			return _node->_kv;
		}

		ptr operator->()
		{
			return &_node->_kv;
		}

		bool operator!=(self& s)
		{
			return s._node != _node;
		}

		self& operator++()
		{
			if (_node->_next != nullptr)
			{
				_node = _node->_next;
			}
			else
			{
				KeyofT kot;
				Hash ht;
				size_t hashi = ht(kot(_node->_kv)) % _tbptr->_tables.size();
				hashi++;
				while (hashi < _tbptr->_tables.size() && _tbptr->_tables[hashi] == nullptr)
				{
					hashi++;
				}
				if (hashi == _tbptr->_tables.size())
				{
					_node = nullptr;
				}
				else
				{
					_node = _tbptr->_tables[hashi];
				}
			}
			return *this;
		}

	};


	template<class k, class T, class KeyofT, class Hash>
	class HashTable
	{
		typedef HashNode<T> Node;
	public:
		template<class k, class T, class ref, class ptr,class KeyofT, class Hash>
		friend class IteratorHash;
		typedef IteratorHash<k, T, T&, T*, KeyofT, Hash> Iterator;
		typedef IteratorHash<k, T, const T&, const T*, KeyofT, Hash> ConstIterator;

		HashTable()
		{
			_tables.resize(10, nullptr);
		}

		~HashTable()
		{
			for (size_t i = 0; i < _tables.size(); i++)
			{
				while (_tables[i])
				{
					Node* root = _tables[i]->_next;
					delete _tables[i];
					_tables[i] = root;
				}
				_tables[i] = nullptr;
			}
		}

		Iterator Begin()
		{
			if (_n == 0) return Iterator(nullptr, this);
			else
			{
				int i = 0;
				while (_tables[i] == nullptr)
				{
					i++;
				}
				return Iterator(_tables[i], this);
			}
		}

		ConstIterator Begin()const
		{
			if (_n == 0) return ConstIterator(nullptr, this);
			else
			{
				int i = 0;
				while (_tables[i] == nullptr)
				{
					i++;
				}
				return ConstIterator(_tables[i], this);
			}
		}

		Iterator End()
		{
			return Iterator(nullptr, this);
		}		
		
		ConstIterator End()const
		{
			return ConstIterator(nullptr, this);
		}

		pair<Iterator, bool> Insert(const T& kv)
		{
			Hash hot;
			KeyofT kot;
			if (_n == _tables.size())
			{
				vector<Node*> _newtables(_tables.size() * 2, nullptr);
				for (size_t i = 0; i < _tables.size(); i++)
				{
					while(_tables[i])
					{
						Node* root = _tables[i]->_next;
						int hashi = hot(kot(_tables[i]->_kv)) % (_tables.size()*2);
						_tables[i]->_next = _newtables[hashi];
						_newtables[hashi] = _tables[i];
						_tables[i] = root;
					}
				}
				_tables.swap(_newtables);
			}
			int hashi = hot(kot(kv)) % _tables.size();
			Node* root = _tables[hashi];
			_tables[hashi] = new Node(kv);
			_tables[hashi]->_next = root;
			_n++;
			return { Iterator(_tables[hashi], this), true};
		}

		Iterator Find(const k& key)
		{
			Hash hot;
			KeyofT kot;
			int hashi = hot(key) % _tables.size();
			Node* root = _tables[hashi];
			while (root)
			{
				if (kot(root->_kv) == key)
				{
					return Iterator(root, this);
				}
				root = root->_next;
			}
			return Iterator(nullptr, this);
		}

		bool Erase(const k& key)
		{
			Hash hot;
			KeyofT kot;
			int hashi = hot(key) % _tables.size();
			Node* root = _tables[hashi];
			Node* prev = nullptr;
			while (root)
			{
				if (kot(root->_kv) == key)
				{
					if (prev == nullptr)
					{
						_tables[hashi] = root->_next;
					}
					else
					{
						prev->_next = root->_next;
					}
					delete root;
					_n--;
					return true;
				}
				prev = root;
				root = root->_next;
			}
			return false;
		}


	private:
		vector<Node*> _tables;
		size_t _n = 0;
	};
}

unordered_set:

	#include"hashtable.h"

    template<class k, class Hash = Hashfunc<k>>
	class unordered_set
	{
		struct SetKeyofT
		{
			const k& operator()(const k& key)
			{
				return key;
			}
		};

	public:
		typedef typename HashTable<k, const k, SetKeyofT, Hash>::Iterator iterator;
		typedef typename HashTable<k, const k, SetKeyofT, Hash>::ConstIterator const_iterator;

		iterator begin()
		{
			return _t.Begin();
		}		
		
		const_iterator begin()const
		{
			return _t.Begin();
		}

		iterator end()
		{
			return _t.End();
		}		
		
		const_iterator end()const
		{
			return _t.End();
		}

		pair<iterator, bool> insert(const k& key)
		{
			return _t.Insert(key);
		}

		iterator find(const k& key)
		{
			_t.Find(key);
		}

		bool erase(const k& key)
		{
			return _t.Erase(key);
		}


	private:
		HashTable<k, const k, SetKeyofT, Hash> _t;
	};

unordered_map:

#include"hashtable.h"


namespace bit
{

	template<class k, class T, class Hash = Hashfunc<k>>
	class unordered_map
	{
		struct MapKeyofT
		{
			const k& operator()(const pair<k, T>& key)
			{
				return key.first;
			}
		};
	public:
		typedef typename HashTable<k, pair<const k, T>, MapKeyofT, Hash>::Iterator iterator;
		typedef typename HashTable<k, pair<const k, T>, MapKeyofT, Hash>::ConstIterator const_iterator;


		iterator begin()
		{
			return _t.Begin();
		}

		const_iterator begin()const
		{
			return _t.Begin();
		}

		iterator end()
		{
			return _t.End();
		}

		const_iterator end()const
		{
			return _t.End();
		}

		pair<iterator, bool> insert(const pair<k, T>& kv)
		{
			return _t.Insert(kv);
		}

		T& operator[](const k& k)
		{
			return (*(insert({ k, T() }).first)).second;
		}

		iterator find(const k& k)
		{
			return _t.Find(k);
		}

		bool erase(const k& k)
		{
			return _t.Erase(k);
		}

	private:
		HashTable<k, pair<const k, T>, MapKeyofT, Hash> _t;
	};

感谢大家的观看!

标签:容器,return,tables,hashi,kv,const,root,unordered,系列
From: https://blog.csdn.net/2301_80468112/article/details/141787242

相关文章

  • 【运维系列】如何为日志开放安全策略
    网络中日志流量的典型组网如【图1】所示。通常,路由器、交换机、服务器等设备向日志主机发送Syslog日志信息使用UDP514端口。如果日志流经防火墙,需要在防火墙上开放安全策略。【图1】日志输出典型组网防火墙支持输出多种类型的日志。在输出日志信息到日志服务器时,部分日志......
  • 【运维系列】如何为HTTP、HTTPS和RESTCONF开放安全策略
    防火墙提供了简单易用的WebUI。用户从浏览器访问承载在防火墙上的HTTPServer,可以完成绝大部分的配置管理工作。缺省情况下,防火墙启用HTTPS服务,服务端口为8443,且不可修改。从浏览器发起的HTTP访问会被重定向到HTTPS。RESTCONF以HTTP协议的方法提供了NETCONF协议的核心功能,编程接......
  • 【运维系列】如何为Telnet开放安全策略
    常见的管理协议,如Telnet、SSH、FTP,具有相似的业务模型。先看Telnet。如图1-1所示,网络中可能有三种业务访问关系。【入方向(Inbound)流量】:从管理终端Telnet防火墙的接口地址,是访问防火墙的流量。【出方向(Outbound)流量】:从防火墙Telnet服务器的地址,属于从防火墙发出的流量。【穿墙......
  • 【运维系列】如何为Ping和Tracert开放安全策略
    Ping和Tracert是基于ICMP协议的常用网络诊断工具。ICMP即互联网控制消息协议(InternetControlMessageProtocol),用于在IP网络中传递控制消息,如报告错误、交换状态信息等。这些消息为管理员诊断网络故障提供帮助。一、Ping为了正常的网络诊断需要,你可能需要允许防火墙主动Ping上......
  • 【运维系列】如何为NETCONF开放安全策略
    NETCONF(NetworkConfigurationProtocol,网络配置协议)是一种基于XML的网络管理协议,它提供了一种对网络设备进行配置和管理的可编程方法。NETCONF协议的传输层可以是BEEP、SSH、TLS或SOAP。由于RFC协议规定必须支持SSH,所以目前SSH是NETCONF使用最广泛的传输层协议,当前华为防火墙产......
  • 【运维系列】如何为SNMP开放安全策略
    SNMP是最广泛使用的网络管理协议。网管软件作为SNMPManager,向被管设备中的SNMPAgent发出管理操作的请求。被管设备在检测到异常时,也会主动向SNMPManager发送Trap信息。也就是说,网管软件和被管设备都会主动发起连接,如图6-1所示。【图】SNMP典型组网和业务访问关系因此,你......
  • Blazor基础学习填坑系列-02-添加依赖包
    继续学习官方给出的demo,参照示例代码,添加包引用时卡住了,官方给出的包的版本6.0.X明显跟当前用的不一致 心想,就别在终端中敲指令了,干脆手动添加吧,结果找不到入口,摸索了下,终于找到:依赖项-包,右键-管理NuGet程序包 根据依赖包名搜索,安装,版本号会自动带出,代码会自动补全......
  • CSS 中的图像、媒体和表单元素——WEB开发系列23
    Web开发中,图像、媒体和表单元素是构建用户界面的重要组成部分。正确地使用CSS来处理这些元素可以大幅提高用户体验,增强页面的美观性和功能性。一、什么是替换元素?图像和视频被描述为“替换元素”。这意味着CSS不能影响它们的内部布局——而仅影响它们在页面上相对于其他元素的......
  • 【Python系列】signal信号处理
    ......
  • 【Linux系列】du命令详解
    ......