Trie
基本用法&作用
快速地存储和查找字符串集合的数据结构
我们在使用 trie 的过程中,我们使用的字符串一定是 都是 大写/小写,并且长度不长
比分说我们有字符串:
abcdef
abdef
aced
bcdf
cdaa
bcdc
bcff
首先 trie 树有一个根节点 root
我们现在将第一个字符串存进来,我们在存的时候是从前往后遍历每一个字符
首先遍历到的是 字符 a,检查有没有 a 作为子节点,没有的话就把 a 结点创建下来
再遍历到 b,检查 a 下有没有 b 作为子节点,没有就把 b 结点创建下来
graph TD; ROOT-->a-->b-->c-->d-->e-->f;再接下来 存储 第二个字符串 abdef
同样我们检查 root 下有没有 a 作为子结点,如果没有就创立一个 a 子结点,那么显然是有的,那就不用操作继续往下走,直到走到 d,发现 b 下没有 d 作为子结点,依次类推检查 d 下有没有 e 作为子结点
graph TD; ROOT-->a-->b-->c-->d-->e-->f; b-->d_1-->e_1-->f_1最后我们构造的树如下:
graph TD; ROOT-->a-->b-->c-->d-->e-->f; b-->d_1-->e_1-->f_1; a-->c_2-->e_2-->d_2; ROOT-->b_3-->c_3-->d_3-->f_3 ROOT-->c_4-->d_4-->a_4-->a_44 d_3-->c_5 c_3-->f_6-->f_66当然我们要在每个单词的结尾做一个标记,不然假设我们现在 进来一个 abc ,我们就无法检测出来这个字符串
此时模拟查找的过程
- 查找 bcdf,首先在 root的子节点中查找 b,再在 b 的子节点中查询 c,依次类推查找到 f ,检查有无终止标记
- 查找 abc,确实查到了 c 结点,但是 c 没有终止标记,所以返回查找失败
- 查找 bacd,在 b 的子节点中,并没有查找到 a 作为子节点,所以该字符串不存在,返回查找失败
模板
int son[N][26], cnt[N], idx;
// 0号点既是根节点,又是空节点
// son[][]存储树中每个节点的子节点
// cnt[]存储以每个节点结尾的单词数量
// 插入一个字符串
void insert(char *str)
{
int p = 0;
for (int i = 0; str[i]; i ++ )
{
int u = str[i] - 'a';
if (!son[p][u]) son[p][u] = ++ idx;
p = son[p][u];
}
cnt[p] ++ ;
}
// 查询字符串出现的次数
int query(char *str)
{
int p = 0;
for (int i = 0; str[i]; i ++ )
{
int u = str[i] - 'a';
if (!son[p][u]) return 0;
p = son[p][u];
}
return cnt[p];
}
练习
维护一个字符串集合,支持两种操作:
I x
向集合中插入一个字符串 x;Q x
询问一个字符串在集合中出现了多少次。共有 N 个操作,输入的字符串总长度不超过 105,字符串仅包含小写英文字母。
输入格式
第一行包含整数 N,表示操作数。
接下来 N 行,每行包含一个操作指令,指令为
I x
或Q x
中的一种。输出格式
对于每个询问指令
Q x
,都要输出一个整数作为结果,表示 x 在集合中出现的次数。每个结果占一行。
数据范围
1≤N≤2∗104
输入样例:
5 I abc Q abc Q ab I ab Q ab
输出样例:
1 0 1
#include<iostream>
using namespace std;
int n;
const int N = 100010;
int son[N][26],cnt[N],idx;
char str[N];
// idx 当前用到的是哪个下标,下标是 0 的点,既是根节点,又是空结点
void insert(char str[])
{
int p = 0;
for(int i = 0;str[i];i++)
{
int u = str[i] - 'a';
if(!son[p][u])
{
son[p][u] = ++idx;
}
p = son[p][u];
}
cnt[p]++;
}
int query(char str[])
{
int p = 0;
for(int i = 0;str[i];i++)
{
int u = str[i] - 'a';
if(!son[p][u])
{
return 0;
}
p = son[p][u];
}
return cnt[p];
}
int main()
{
cin.tie(0);
ios::sync_with_stdio(false);
cin >> n;
while(n--)
{
char op[2];
cin >> op >> str;
if(op[0] == 'I')
{
insert(str);
}else{
cout << query(str) << endl;
}
}
return 0;
}
在给定的 NN 个整数 A1,A2……AN 中选出两个进行 xor(异或)运算,得到的结果最大是多少?
输入格式
第一行输入一个整数 N。
第二行输入 N 个整数 A1~AN。
输出格式
输出一个整数表示答案。
数据范围
1≤N≤105
0≤Ai<231输入样例:
3 1 2 3
输出样例:
3
#include<iostream>
using namespace std;
const int N=100010,M=31*N;
int n;
int a[N];
int son[M][2],idx = 0;
// M 代表一个数字串二进制可以有多长
void insert(int x)
{
int p = 0;
for(int i = 30;i >= 0;i--)
{
int u = x>>i&1; // 取出 x 的第i位的二进制数是什么
if(!son[p][u])
{
son[p][u] = ++idx; // 插入的时候发现没有该子节点,就开辟一个新路
}
p = son[p][u]; // 指针指向下一层
}
}
int search(int x)
{
int p = 0;int res = 0;
for(int i = 30;i >= 0;i--)
{
int u = x>>i&1;
if(son[p][!u]) // 如果当前层有对应的不相同的数
{ // p 就指向相应的位置
p = son[p][!u];
res = res * 2 + 1;
}else{
p = son[p][u];
res = res * 2 + 0;
}
}
return res;
}
int main()
{
cin.tie(0);
ios::sync_with_stdio(false);
cin >> n;
for(int i = 0;i < n;i++)
{
cin >> a[i];
insert(a[i]);
}
int res = 0;
for(int i = 0;i < n;i++)
{
res = max(res,search(a[i]));
}
cout << res << endl;
return 0;
}
标签:07,--,++,son,trie,int,str,字符串
From: https://www.cnblogs.com/ShibuyaKanon/p/16792452.html