洛谷深基hash表

字符串哈希

给定 N 个字符串（第 i个字符串长度为 M_i，字符串内包含数字、大小写字母，大小写敏感），请求出 N 个字符串中共有多少个不同的字符串。

我们不妨先分析简化版的问题：

给定N个自然数，值域为[0,10⁹]，求出N个自然数中共有多少个不同的自然数

如果值域为[0,10⁷]，可以利用计数排序，定义数组a[1e7]，出现就++，最后统计有多少非0

当值域拓展到[0,10⁹]，可以取一个mod，定义一个大小为mod的数组，然后把每个数对mod取模，如果两个数取mod之后值相同，就默认为两个数相同

#include <bits/stdc++.h>
#define mod 233333
using namespace std;
int n,x,ans,a[mod+5];
int main()
{
    cin>>n;
    for(int i=1;i<=n;i++){
        cin>>x;
        x%=mod;
        if(!a[x])	a[x]=1,ans++;
    }
    cout<<ans<<endl;
    return 0;
}

但是如果有两个数对mod取模之后恰好得到了相同的结果，那么就会起冲突

优化：

把一个int的数组改成一个vector的数组或者一个链表，然后将取模后为同一个属的所有值都存在其对应的vector或者链表中

然后每次判断一个属x是否存在的时候，遍历x%mod位置的vector或者链表中所有元素，看是否有x即可

#include <bits/stdc++.h>
#define mod 233333
using namespace std;
int n,x,ans;
vector<int> linker[mod+2];
inline void insert(int x){
    for(int i=0;i<linker[x%mod].size();i++){
        if(linker[x%mod][i]==x)
            return ;
    }
    linker[x%mod].push_back(X);
    ans++;
}
int main()
{
    cin>>n;
    for(int i=1;i<=n;i++){
        cin>>x;
        insert(x);
    }
    cout<<ans<<endl;
    return 0;
}

举例：当要存储的数字为1 2 3 4 5 6，模数为4的时候,vector内是这样的

0	1	2	3
4	1	2	3
    5	6

当新加入233时，233mod4=1，遍历1的vector，发现里面没有233，就将233push_back到1的vector后面

这样的数据结构就是哈希表，hash表

好，那么前面都是对于数字的处理，那么我们如何将字符串转换为数字呢？

通过ASCII码的原理，我们可以将单个字符映射为一个数字。

我们将字符序列映射成0到mod-1中的一个数字，称为字符串的hash值

\(hash=(hash*k+s[i])\%mod\)

一般来说mod会取一个比较大的质数来避免冲突

那么我们回到原题，由于可能有多个不同的字符串对应同一个hash值，对于每个hash建立一个vector用来存每个hash的所有字符串，每次将插入的字符串呵hash值相同的字符串进行比较，看是否相等，就可以知道是否出现过了

#niclude <bits/stdc++.h>
#define maxn 1510
#define base 261
#define mod 23333
using namespace std;
int n,ans;
char s[maxn];
vector<string> linker[mod+2];
inline void insert(){
    int hash=1;
    for(int i=0;s[i];i++)
        hash=(hash*111*base+s[i])%mod;
    string t=s;
    for(int i=0;i<linker[hash].size();i++){
        if(linker[hash][i]==t)
            return ;
    }
    linker[hash].push_back(t);
    ans++;
}
int main()
{
	cin>>n;
    for(int i=1;i<=n;i++){
		cin>>s;
        insert();
    }
    cout<<ans<<endl;
	return 0;
}

标签：洛谷,int,深基,vector,字符串,hash,define,mod
From： https://www.cnblogs.com/xushengxiang/p/16649530.html

currenthashmap1.7
ConcurrentHashMap采用了分段锁的设计，当需要put元素的时候，并不是对整个hashmap进行加锁，而是先通过hashcode来知道要放在哪一个分段中，然后对这个分段进行加锁，所以当多线程pu......
27 | JAVA集合TreeMap(Map接口下除HashMap实现的另一种实现)
TreeMap我们已经知道，HashMap是一种以空间换时间的映射表，它的实现原理决定了内部的Key是无序的，即遍历HashMap的Key时，其顺序是不可预测的（但每个Key都会遍历一次且仅遍历一次......
内核Hash表
一、Hash表简介1.哈希表(Hashtable)又叫散列表，是根据(Key,Value)键值对进行访问的数据结构。主要目的是提高查询效率，比如Hash表的order为5，也就是同时使用2^5个链表，理......
ConcurrentHashMap中的get和put源码分析
get分析publicVget(Objectkey){//tab：指向数组Node<K,V>[]tab;//e：指向key对应的Node节点、p：Node<K,V>e,p;//n：数组长度、eh：key对应节点......
一致性哈希算法 consistent hashing
在了解一致性哈希算法之前，最好先了解一下缓存中的一个应用场景，了解了这个应用场景之后，再来理解一致性哈希算法，就容易多了，也更能体现出一致性哈希算法的优点，那么，我们先......
HashMap面试相关
HashMap源码:加载因子:loadFactory--默认0.75f初始容量大小:capacity默认16,最大限制1<<30扩容:当数组元素的数量>初始容量大小*加载因子,就会扩容.会调......
LinkedHashMap源码及LRU实现原理
基本认识LinkedHashMap位于java.util包，于JDK1.4引入，属于JavaCollectionsFramework的成员。查看其UML关系如下图所示：HashMap在很多场景下都满足K-V的存取，而且在非多线......
JS hashCode()
functionhashcode(str){varhash=0,i,chr,len;if(str.length===0)returnhash;for(i=0,len=str.length;i<len;i++){chr=str.charCo......
[洛谷P5787] 线段树时间分治
题目大意给\(n\)个点\(m\)条边，在\(k\)时间内，第\(i\)条边只在\([l_i+1,r_i]\)的时间范围内存在。对于每个\(i\leqk\)，输出\(i\)时刻这个图是否是二分图。题......
BrowserRouter和HashRouter的区别
底层原理不一样BrowserRouter使用的是H5的historyAPI，不兼容IE9及以下版本。HashRouter使用的是URL的hash值path表现形式不一样BrowserRouter的路径中没有#Has......

洛谷深基hash表

洛谷深基hash表

字符串哈希

相关文章

赞助商

阅读排行