首页 > 其他分享 >11. 全文搜索引擎ES(elasticsearch)

11. 全文搜索引擎ES(elasticsearch)

时间:2023-02-20 09:25:39浏览次数:51  
标签:11 倒排 索引 文档 分词器 elasticsearch 分词 ES

ES的倒排索引

倒排索引 也被称作反向索引(inverted index),是用于提高数据检索速度的一种数据结构,空间消耗比较大。倒排索引首先将检索文档进行分词得到多个词语/词条,然后将词语和文档 ID 建立关联,从而提高检索效率

分词器

分词器是搜索引擎的一个核心组件,负责对文档内容进行分词(在 ES 里面被称为 Analysis),也就是将一个文档转换成 单词词典(Term Dictionary) 。单词词典是由文档中出现过的所有单词构成的字符串集合。为了满足不同的分词需求,分词器有很多种,不同的分词器分词逻辑可能会不一样。
IK Analyzer(推荐): 最常用的开源中文分词器

标签:11,倒排,索引,文档,分词器,elasticsearch,分词,ES
From: https://www.cnblogs.com/song-hua/p/17136193.html

相关文章