首页 > 其他分享 >【9.7】树结构-实现 Trie (前缀树)

【9.7】树结构-实现 Trie (前缀树)

时间:2025-01-19 19:03:15浏览次数:3  
标签:word 树结构 Trie parentNode TrieNode 字符串 9.7 节点

一、题目

Trie(发音类似 "try")或者说 前缀树 是一种树形数据结构,用于高效地存储和检索字符串数据集中的键。这一数据结构有相当多的应用情景,例如自动补全和拼写检查。

请你实现 Trie 类:

  • Trie() 初始化前缀树对象。
  • void insert(String word) 向前缀树中插入字符串 word
  • boolean search(String word) 如果字符串 word 在前缀树中,返回 true(即,在检索之前已经插入);否则,返回 false
  • boolean startsWith(String prefix) 如果之前已经插入的字符串 word 的前缀之一为 prefix ,返回 true ;否则,返回 false

示例:

输入
["Trie", "insert", "search", "search", "startsWith", "insert", "search"]
[[], ["apple"], ["apple"], ["app"], ["app"], ["app"], ["app"]]
输出
[null, null, true, false, true, null, true]

解释
Trie trie = new Trie();
trie.insert("apple");
trie.search("apple");   // 返回 True
trie.search("app");     // 返回 False
trie.startsWith("app"); // 返回 True
trie.insert("app");
trie.search("app");     // 返回 True

提示:

  • 1 <= word.length, prefix.length <= 2000
  • wordprefix 仅由小写英文字母组成
  • insertsearchstartsWith 调用次数 总计 不超过 3 * 10^4

二、解题思路

        Trie树,又称字典树,其工作原理类似于查字典的过程。举个例子,如果我们要查找单词“wo”,首先需要定位到字母“w”,然后再找到字母“o”。从结构上看,Trie树可以理解为一棵多叉树,每个节点最多可以拥有多个子节点。在本题中,由于单词和前缀仅由小写英文字母组成,而小写字母共有26个,因此Trie树可以被视为一棵26叉树。下图展示了这种结构的具体形式。

        Trie树的结构从一个空的根节点开始,根节点本身并不存储任何具体的值。从根节点出发,可以延伸出最多26个子节点,每个子节点又可以进一步扩展出最多26个子节点,以此类推。以字符串为例,假设我们有以下几个字符串:

        - "ac"
        - "bcd"
        - "ace"
        - "ef"

        它们在Trie树中的存储方式如下:

                1. 从根节点出发,字符串“ac”会沿着路径 `a -> c` 存储。
                2. 字符串“bcd”会沿着路径 `b -> c -> d` 存储。
                3. 字符串“ace”会沿着路径 `a -> c -> e` 存储。
                4. 字符串“ef”会沿着路径 `e -> f` 存储。

        通过这种方式,Trie树能够高效地存储和检索字符串,同时共享相同的前缀以减少空间占用。

        然而,这里存在一个问题:虽然我们没有明确存储字符串“bc”,但上面的Trie树中却包含了“bc”这一路径。此外,路径中还包含了“a”、“b”、“e”等字符。实际上,这些字符并不是一个完整的字符串,而是我们存储的某些字符串的前缀。那么,如何区分一个路径是否代表一个完整的字符串呢?为了解决这个问题,我们需要对字符串的最后一个字符进行特殊标记,表示这是一个完整字符串的结束。具体实现方式如下图所示。

        如上图所示,字符串“bc”并不是一个完整的字符串,因为它的最后一个字符“c”没有被标记为结束节点。至于如何标记一个字符串的结束,可以根据具体需求来设计。在这里,我们使用一个布尔类型的变量来进行标记,表示某个节点是否为某个字符串的结尾。

        需要注意的是,这里的节点类并没有直接存储单个字符的值。我们通过判断某个子节点是否为空,来推断对应的字符是否存在。例如,如果我们想查找字符“a”,由于“a”对应的是26个子节点中的第一个节点,我们只需要检查第一个子节点是否为空即可。如果该子节点为空,说明字符“a”不存在;反之,则说明字符“a”存在。

三、代码实现

#include <iostream>
#include <string>
using namespace std;

// Trie 节点类
class TrieNode {
public:
    TrieNode* children[26]; // 26 个子节点,对应 26 个小写字母
    bool isWord; // 标记是否为完整单词的结尾

    TrieNode() {
        for (int i = 0; i < 26; i++) {
            children[i] = nullptr;
        }
        isWord = false;
    }
};

// Trie 类
class Trie {
private:
    TrieNode* root; // 根节点

public:
    Trie() {
        root = new TrieNode();
    }

    // 插入字符串
    void insert(string word) {
        TrieNode* parentNode = root;
        for (char ch : word) {
            int index = ch - 'a'; // 计算字符对应的索引
            if (parentNode->children[index] == nullptr) {
                parentNode->children[index] = new TrieNode(); // 如果子节点不存在,则创建
            }
            parentNode = parentNode->children[index]; // 更新父节点
        }
        parentNode->isWord = true; // 标记为完整单词
    }

    // 查找是否是一个完整的字符串
    bool search(string word) {
        TrieNode* node = find(word);
        return node != nullptr && node->isWord;
    }

    // 判断是否有以 prefix 为前缀的字符串
    bool startsWith(string prefix) {
        return find(prefix) != nullptr;
    }

private:
    // 查找字符串对应的节点
    TrieNode* find(string str) {
        TrieNode* parentNode = root;
        for (char ch : str) {
            int index = ch - 'a';
            if (parentNode->children[index] == nullptr) {
                return nullptr; // 如果某个字符不存在,返回 nullptr
            }
            parentNode = parentNode->children[index]; // 更新父节点
        }
        return parentNode; // 返回最后一个字符对应的节点
    }
};

// 测试代码
int main() {
    Trie trie;
    trie.insert("apple");
    cout << "Search 'apple': " << (trie.search("apple") ? "Found" : "Not Found") << endl; // 输出: Found
    cout << "Search 'app': " << (trie.search("app") ? "Found" : "Not Found") << endl; // 输出: Not Found
    cout << "Starts with 'app': " << (trie.startsWith("app") ? "Yes" : "No") << endl; // 输出: Yes

    trie.insert("app");
    cout << "Search 'app': " << (trie.search("app") ? "Found" : "Not Found") << endl; // 输出: Found

    return 0;
}

 

标签:word,树结构,Trie,parentNode,TrieNode,字符串,9.7,节点
From: https://blog.csdn.net/linshantang/article/details/145221580

相关文章

  • 【9.1】树结构-从先序遍历还原二叉树
    一、题目        我们从二叉树的根节点root 开始进行深度优先搜索。        在遍历中的每个节点处,我们输出 D 条短划线(其中 D 是该节点的深度),然后输出该节点的值。(如果节点的深度为D,则其直接子节点的深度为D+1。根节点的深度为0)。       ......
  • 2025dsfz集训Day7: KMP与Trie树
    Day7:KMP与Trie树KMP算法\(KMP(Knuth–Morris–Pratt)\)是一个字符串匹配算法,于1977年由上述三人共同发表。在线性的时空复杂度内解决字符串匹配。字符串匹配给定两个字符串\(s,t\)(通常来讲我们管较短的串叫做“模式串”,长的叫“匹配串”。我们的任务是在长串内找到......
  • 科普文:算法和数据结构系列【高效的字符串检索结构:字典树Trie树原理、应用及其java示例
    概叙科普文:算法和数据结构系列【算法和数据结构概叙】-CSDN博客科普文:算法和数据结构系列【非线性数据结构:树Tree和堆Heap的原理、应用、以及java实现】-CSDN博客科普文:算法和数据结构系列【树:4叉树、N叉树】_动态维护四叉树-CSDN博客科普文:算法和数据结构系列【二叉树总结......
  • 【LeetCode】力扣刷题热题100道(31-35题)附源码 搜索二维矩阵 岛屿数量 腐烂的橙子 课程
    一、搜索二维矩阵编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target 。该矩阵具有以下特性:每行的元素从左到右升序排列。每列的元素从上到下升序排列。可以使用从右上角开始搜索的方法来有效地找到目标值。选择起始位置:从矩阵的右上角开始。......
  • THREE.js学习笔记6——Geometries
    这一小节学习THREE.js中的物理模型。什么是geometry?(英文解释,翻译为中文就看不懂了,直接看英语吧)Composedofvertices(pointcoordinatesin3Dspaces)andfaces(trianglesthatjointhoseverticestocreateasurface)Canbeusedformeshesbutalsoforparticles......
  • 利用WikipediaRetriever集成Wikipedia内容到AI应用
    在当今信息爆炸的时代,如何高效地获取和利用海量的知识资源成为一个备受关注的问题。Wikipedia是全球最大、最受欢迎的百科全书资源之一,它由来自世界各地的志愿者共同维护和更新。WikipediaRetriever为开发者提供了一种简单而高效的方式,将Wikipedia的内容集成到各类AI应用中,......
  • [数据结构学习笔记11] 前序树(Trie/Prefix tree)
    前序树(Trie/Prefixtree),它的一个典型的应用场景在搜索引擎里,当你输入查询关键字的时候,会联想自动补齐你想要输入的内容。比如,你输入app,下面可能会出来联想Apple,Applied等等。什么是Trie?Trie(读作Try)是这样一个数据结构,它把短语或者单词分解字母,然后以一种方式去存储,让添加、删......
  • 208. 实现 Trie (前缀树)
    [题目链接](208.实现Trie(前缀树)-力扣(LeetCode))解题思路:前缀树,每个节点的内容:pre:经过该节点的数目;end:以该节点结尾的数目;nexts:下一条路径。前缀树有一个根节点,每次查找、插入、删除都要从这个节点开始。插入时,遍历该字符串,先从根节点开始,查看nexts是否有该字符,有就复......
  • 搜索补全(一):倒排索引与Trie的魔法
    搜索补全技术:提升用户体验的智能助手搜索系列相关文章(置顶)1.原始信息再加工:一文读懂倒排索引2.慧眼识词:解析TF-IDF工作原理3.超越TF-IDF:信息检索之BM254.深入浅出BeamSearch:自然语言处理中的高效搜索利器5.搜索补全(一):倒排索引与Trie的魔法6.搜索补全(二):Trie树经典......
  • 【PostgreSQL数据库-Tried to send an out-of-range integer as a 2-byte value: 5356
    业务侧反馈,因为某业务积攒的单量太大,导致在数据批量入库的时候,产生如下报错,主要报错信息是:请求参数的整体大小不能超过2byte。Triedtosendanout-of-rangeintegerasa2-bytevalue:53568这个报错初步看起来,有个“out-of-rangeinteger”,可能大家第一个想到的可能......