首页 > 其他分享 >ElasticSearch中使用ik分词器进行实现分词操作

ElasticSearch中使用ik分词器进行实现分词操作

时间:2024-03-21 15:47:39浏览次数:28  
标签:热词 nginx ik ElasticSearch 分词器 分词 ES

简介:在默认的情况下,ES中只存在Stander分词器,但是这个分词器往往不满足我们的分词需求,这里通过ik分词器进行自定义我们的分词操作
1、第一步将ik分词器进行下载
下载地址:https://github.com/medcl/elasticsearch-analysis-ik
需要注意,需要选择和自己的ES版本对应的版本
2、将ik分词器解压之后放到ES的插件目录下
在默认的情况下,IK分词器提供了两种分词方式,一种是ik_smart方式,一种是ik_max_word方式,
第一种方式为智能分词,基本可以将一句话进行分词处理,但是对于一些网络热词就不适用了,
第二种方式解释为,它会将一句话进行最大限制的分词,例如我是中国人,可以分为我、是、中国人、国人、中国等,它也存在无法将热词进行分词的操作
如果想要实现热词分词的话,可以采用第三种方式:通过修改IK分词器的远程分词地址实现分词(请求一个地址获取分词)
这里通过nginx举例(也可以通过Django、tomcat等实现)
实现方式:
在nginx的html目录中创建es目录,在目录中创建一个文本文件,在文件中写入一些热词

访问nginx查看效果

在ik分词器的配置中设置远程分词地址,配置文件位置如下

将配置在nginx中的分词文件地址复制到指定位置即可

最后重启ES查看效果,当然,需要在配置分词器的时候使用ik分词器才可以哟

标签:热词,nginx,ik,ElasticSearch,分词器,分词,ES
From: https://www.cnblogs.com/just1t/p/18087517

相关文章

  • 3.分词器(Analyzer)
    分词器有什么用?分词器是搜索引擎的一个核心组件,负责对文档内容进行分词(在ES 里面被称为Analysis),也就是将一个文档转换成单词词典(Term Dictionary)。单词词典是由文档中出现过的所有单词构成的字符串集合。为了满足不同的分词需求,分词器有很多种,不同的分词器分词逻辑可能......
  • Minimal BASH-like line editingis supported解决方法
    一、问题原因        Windows/Linux双启动的电脑一般都使用grub作为引导程序,出现这个原因,是windows启动的时候,没有找到启动文件。我是因为安装了windows和Linux双系统,卸载Ubuntu系统时,没有完全删除Ubuntu的相关信息,重启电脑将无法正常进入Windows系统,开机后一直卡在gr......
  • ElasticSearch - 基本操作
    前言本文记录ES的一些基本操作,就是对官方文档的一些整理,按自己的习惯重新排版,凑合着看。官方的更详细,建议看官方的。下文以books为索引名举例。新增添加单个文档(没有索引会自动创建)POSTbooks/_doc{"name":"SnowCrash","author":"NealStephenson","release_dat......
  • Elasticsearch-Mapping映射
    Mapping映射自动或手动为index中的_doc建立一种数据结构和相关配置动态映射:dynamicmapping,自动为我们建立index,以及对应的mapping,mapping中包含了每个field对应的数据类型,以及如何分词等设置。PUT/web_site/_doc/1{"post_date":"2023-01-01","title":"Thelonger",......
  • Docker 上安装部署 Elasticsearch(ES)详细教程
    前言Elasticsearch(简称ES)是一个支持海量搜索引擎服务,当一个分布式系统需要支持海量搜索服务时都会优先上ES。因此掌握ES技术也是一门进入大厂拿高薪的必修课,笔者一直在追求深入掌握ES技术,一方面希望自己有机会还能进大厂并站稳脚跟。退一步讲就算进不了大厂,自己也要能具备......
  • in,not in,like,not like,=,!=与null的恩怨情仇
    1.情景展示当字段值为null时,会给我们的查询带来不小的麻烦,今天就来聊一聊:in(),notin(),like,notlike,=,!=或<>在字段值为null时,出现的各种问题。2.具体分析以oracle进行举例分析。in()  notin() like notlike = !=或<> 3.解决方案使用exists(),no......
  • Elasticsearch运维指南
    1.常用监控工具1.1cerebro⼯具地址:https://github.com/lmenezes/cerebro1.2KibanaStackMonitoring地址:https://www.elastic.co/guide/en/kibana/current/xpack-monitoring.html2.关键指标监控2.1集群健康维度:分⽚和节点通过GET_cluster/health监视群集时,可以查询......
  • pikachu靶场第八关——XSS(跨站脚本)之DOM型xss(附代码审计)
    什么是DOM?简单来说DOM文档就是一份XML文档,当有了DOM标准之后,DOM便将前端html代码化为一个树状结构,方便程序和脚本能够轻松的动态访问和更新这个树状结构的内容、结构以及样式,且不需要经过服务端,所以DOM型xss在js前端自己就可以完成数据的输入输出,不与服务器产生交互,这样来说DO......
  • 关于电化学储能BMS系统的一些研究(@Like预告)
    关于电化学储能BMS系统的一些研究(@Like预告)电化学储能术语u BMS电池管理系统(感知)u EMS能量管理系统(决策)u PCS储能变流器(执行)u BMS三层架构BAMS、BCU、BMUu BAMS(BSU)总控(堆控)储能电池总控系统u BCMU(BCU)主控(簇控)电池组控制管理单元u BMU(BMU)从控(从控)电池单体......
  • Elasticsearch-批量操作(bulk)
    bulk的基础概念bulk是es提供的一种批量增删改的操作API。bulk的语法bulk对JSON串的有着严格的要求。每个JSON串不能换行,只能放在同一行,同时,相邻的JSON串之间必须要有换行(Linux下是\n;Window下是\r\n)。bulk的每个操作必须要一对JSON串(delete语法除外)。PUT/_bulk{"action":......