首页 > 其他分享 >通关数据结构 day_07 -- trie

通关数据结构 day_07 -- trie

时间:2022-10-14 17:56:24浏览次数:68  
标签:07 -- ++ son trie int str 字符串

Trie

基本用法&作用

快速地存储和查找字符串集合的数据结构

我们在使用 trie 的过程中,我们使用的字符串一定是 都是 大写/小写,并且长度不长

比分说我们有字符串:

abcdef

abdef

aced

bcdf

cdaa

bcdc

bcff

首先 trie 树有一个根节点 root

我们现在将第一个字符串存进来,我们在存的时候是从前往后遍历每一个字符

首先遍历到的是 字符 a,检查有没有 a 作为子节点,没有的话就把 a 结点创建下来

再遍历到 b,检查 a 下有没有 b 作为子节点,没有就把 b 结点创建下来

graph TD; ROOT-->a-->b-->c-->d-->e-->f;

再接下来 存储 第二个字符串 abdef

同样我们检查 root 下有没有 a 作为子结点,如果没有就创立一个 a 子结点,那么显然是有的,那就不用操作继续往下走,直到走到 d,发现 b 下没有 d 作为子结点,依次类推检查 d 下有没有 e 作为子结点

graph TD; ROOT-->a-->b-->c-->d-->e-->f; b-->d_1-->e_1-->f_1

最后我们构造的树如下:

graph TD; ROOT-->a-->b-->c-->d-->e-->f; b-->d_1-->e_1-->f_1; a-->c_2-->e_2-->d_2; ROOT-->b_3-->c_3-->d_3-->f_3 ROOT-->c_4-->d_4-->a_4-->a_44 d_3-->c_5 c_3-->f_6-->f_66

当然我们要在每个单词的结尾做一个标记,不然假设我们现在 进来一个 abc ,我们就无法检测出来这个字符串

此时模拟查找的过程

  1. 查找 bcdf,首先在 root的子节点中查找 b,再在 b 的子节点中查询 c,依次类推查找到 f ,检查有无终止标记
  2. 查找 abc,确实查到了 c 结点,但是 c 没有终止标记,所以返回查找失败
  3. 查找 bacd,在 b 的子节点中,并没有查找到 a 作为子节点,所以该字符串不存在,返回查找失败

模板

int son[N][26], cnt[N], idx;
// 0号点既是根节点,又是空节点
// son[][]存储树中每个节点的子节点
// cnt[]存储以每个节点结尾的单词数量

// 插入一个字符串
void insert(char *str)
{
    int p = 0;
    for (int i = 0; str[i]; i ++ )
    {
        int u = str[i] - 'a';
        if (!son[p][u]) son[p][u] = ++ idx;
        p = son[p][u];
    }
    cnt[p] ++ ;
}

// 查询字符串出现的次数
int query(char *str)
{
    int p = 0;
    for (int i = 0; str[i]; i ++ )
    {
        int u = str[i] - 'a';
        if (!son[p][u]) return 0;
        p = son[p][u];
    }
    return cnt[p];
}

练习

835. Trie字符串统计 - AcWing题库

维护一个字符串集合,支持两种操作:

  1. I x 向集合中插入一个字符串 x;
  2. Q x 询问一个字符串在集合中出现了多少次。

共有 N 个操作,输入的字符串总长度不超过 105,字符串仅包含小写英文字母。

输入格式

第一行包含整数 N,表示操作数。

接下来 N 行,每行包含一个操作指令,指令为 I xQ x 中的一种。

输出格式

对于每个询问指令 Q x,都要输出一个整数作为结果,表示 x 在集合中出现的次数。

每个结果占一行。

数据范围

1≤N≤2∗104

输入样例:

5
I abc
Q abc
Q ab
I ab
Q ab

输出样例:

1
0
1
#include<iostream>
using namespace std;

int n;
const int N = 100010;
int son[N][26],cnt[N],idx;
char str[N];
//  idx 当前用到的是哪个下标,下标是 0 的点,既是根节点,又是空结点


void insert(char str[])
{
    int p = 0;
    for(int i = 0;str[i];i++)
    {
        int u = str[i] - 'a';
        if(!son[p][u])
        {
            son[p][u] = ++idx;
        }
        p = son[p][u];
    }
    
    cnt[p]++;
}

int query(char str[])
{
    int p = 0;
    for(int i = 0;str[i];i++)
    {
        int u = str[i] - 'a';
        if(!son[p][u])
        {
            return 0;
        }
        p = son[p][u];
    }
    
    return cnt[p];
}

int main()
{
    cin.tie(0);
    ios::sync_with_stdio(false);
    
    cin >> n;
    while(n--)
    {
        char op[2];
        cin >> op >> str;
        if(op[0] == 'I')
        {
            insert(str);
        }else{
            cout << query(str) << endl;
        }
        
    }
    return 0;
}

143. 最大异或对 - AcWing题库

在给定的 NN 个整数 A1,A2……AN 中选出两个进行 xor(异或)运算,得到的结果最大是多少?

输入格式

第一行输入一个整数 N。

第二行输入 N 个整数 A1~AN。

输出格式

输出一个整数表示答案。

数据范围

1≤N≤105
0≤Ai<231

输入样例:

3
1 2 3

输出样例:

3
#include<iostream>
using namespace std;

const int N=100010,M=31*N;
int n;
int a[N];
int son[M][2],idx = 0;
//  M 代表一个数字串二进制可以有多长

void insert(int x)
{
    int p = 0;
    for(int i = 30;i >= 0;i--)
    {
        int u = x>>i&1;     //  取出 x 的第i位的二进制数是什么
        if(!son[p][u])
        {
            son[p][u] = ++idx;  //  插入的时候发现没有该子节点,就开辟一个新路
        }
        p = son[p][u];  //  指针指向下一层
    }
}

int search(int x)
{
    int p = 0;int res = 0;
    for(int i = 30;i >= 0;i--)
    {
        int u = x>>i&1;
        if(son[p][!u])  // 如果当前层有对应的不相同的数
        {   //  p 就指向相应的位置
            
            p = son[p][!u];
            res = res * 2 + 1;
            
        }else{
            p = son[p][u];
            res = res * 2 + 0;
        }
    }
    return res;
}


int main()
{
    cin.tie(0);
    ios::sync_with_stdio(false);
    
    cin >> n;
    for(int i = 0;i < n;i++)
    {
        cin >> a[i];
        insert(a[i]);
    }
    int res = 0;
    for(int i = 0;i < n;i++)
    {
        res = max(res,search(a[i]));
    }
    cout << res << endl;
    return 0;
}

标签:07,--,++,son,trie,int,str,字符串
From: https://www.cnblogs.com/ShibuyaKanon/p/16792452.html

相关文章

  • 配置环境变量
    配置环境变量的目的:使在任意目录下都能执行java.exe这个应用程序两种方法方法一1找到jdk安装的路径,打开bin目录(因为java.exe这个程序在bin目录里面),复制当前路径 2右......
  • Eolink 联合生态伙伴举办2022国产软件开发者大会
    9月24日,由Eolink、云宏、趣米联合主办的“2022新国潮·国产软件开发者大会”在广州成功开展。大会邀请了国产软件领域的技术领袖及行业大咖,围绕九大主题,从国产软硬件生......
  • macwk.com破产关站,真正原因!(免费的替代站)
    2022年10月5日,也就是国庆期间,http://macwk.com正式宣布关站现阶段此网站将无法访问,外界分析原因是因为新接手macwk的团队长期使用OSS下载,而OSS下载本身非常烧钱,但没有充足......
  • php简单实现 远程图片 上传
     思路:服务器A:上传文件,获取临时路径,然后获取base64字符串,将base64字符串发给服务器B服务器B:接受base64字符串,转码后使用file_put_contents添加到文件内,即可实......
  • 课堂五
    目录补充重要内置函数常见内置函数可迭代对象迭代器对象for循环内部原理异常处理重要内置函数(补充)zip函数是可以接收多个可迭代对象,然后把每个可迭代对......
  • 15
    今日内容总结1.内置函数大全#A系列:abs(x)获取绝对值操作aiter()相当于调用x.__aiter__all(x)如果x中的数据值全为真值(或迭代对象为空)则......
  • Java8新特性之Stream流(含具体案例)
    一、概述  Stream流是Java8新提供给开发者的一组操作集合的API,将要处理的元素集合看作一种流,流在管道中传输,并且可以在管道的节点上进行处理,比如筛选、排序、聚......
  • 今日收获——记录日志总结
    1、记录规则:a、不应该返回的位置,需要在标示为记录错误标识。b、日志记录应为【类.方法】状态::错误信息。说明:状态主要记录错误。不是错误的,可以不记录。[CollectData]:......
  • 206. 反转链表
    206.反转链表给你单链表的头节点head,请你反转链表,并返回反转后的链表。示例1:输入:head=[1,2,3,4,5]输出:[5,4,3,2,1]示例2:输入:head=[1,2]输出:[2,1]示例......
  • MySQL进阶
    1、存储引擎1.1、MySQL体系结构连接层:最上层是一些客户端和链接服务,主要完成一些类似于连接处理、授权认证以及相关的安全方案。吴福气也会为安全接入的每个客户端验证......