首页 > 其他分享 >【ES系列七】——ik自定义分词词库

【ES系列七】——ik自定义分词词库

时间:2022-12-05 16:32:45浏览次数:37  
标签:词库 自定义 步骤 ik 测试 分词 es

一、业务场景

    在利用ik分词的过程中,当ik的分词规则不满足我们的需求了,这个时候就可以利用ik的自定义词库进行筛选,举个例子:当我要将“我是中国人,我想测试一下”这句话通过分词,将“我想测试一下”分为一个词的时候,就需要利用ik的自定义词库进行灌入指定的词。

二、新建词库

1.到elasticsearch/plugins中寻找ik插件所在的目录

2.在ik中的config文件中添加词库

         vimmydic.dic

         输入你定义的词,例如:我想测试一下  (注:一行输入一个词)

         :wq!保存命令

3.检查新建词库内容(注意内容中的编码格式)

         catmydic.dic

【ES系列七】——ik自定义分词词库_安装步骤

三、修改ik配置

修改config中的IKAnalyzer.cfg.xml文件(注:词库的位置根据该配置文件的位置来决定所写的路径,一般放在平级目录或者下一级目录下)

         vimIKAnalyzer.cfg.xml

         :wq!保存命令

【ES系列七】——ik自定义分词词库_analyzer_02

四、重启es

1.修改为子账户(具体看:ES安装步骤七):

例如:su es

2.查看es进程号

ps aux|grep elastic

【ES系列七】——ik自定义分词词库_ES_03

3.杀死es进程

Kill -9 29223

4.启动es

sh elasticsearch -d

五、测试

浏览器测试(其它测试请查看:ik安装步骤四):

http://ip:9200/knowledge/_analyze?analyzer=ik_smart&pretty=true&text=”我想测试一下”

注:knowledge为建立的索引名称,ik_smart为粗粒度分词(分词粒度具体查看ik安装步骤五)

【ES系列七】——ik自定义分词词库_ES_04

标签:词库,自定义,步骤,ik,测试,分词,es
From: https://blog.51cto.com/u_14471711/5913036

相关文章

  • 【ES系列三】——ES集成ik分词并测试
    一、下载ik安装包  https://github.com/medcl/elasticsearch-analysis-ik/releases  注:一定要与ES版本保持一致(我ES用的是6.0.0所以ik也要下载6.0.0),如下图:......
  • 直播系统app源码,自定义九宫格,计算器布局,验证码认证
    直播系统app源码,自定义九宫格,计算器布局,验证码认证1、先写几个接收验证码的文本框 returnScaffold(   backgroundColor:ColorsUtil.hexStringColor("#B1B1B1")......
  • pytest + yaml 框架 -5.调用内置方法和自定义函数
    前言在yaml用例文件中,有些数据不是固定的,比如注册账号,我需要每次生成不一样的,那么我们可以调用自己定义的函数pip安装插件pipinstallpytest-yaml-yoyoyaml中调用内置方......
  • el-from表单校验某一项(自定义校验规则)
    <el-form-itemlabel="适用税率"prop="rate":rules="[{validator:(field,value,cb)=>......
  • 小程序自定义扫码界面
    小程序扫一扫wx.scanCode  这个api扫描不能自定义这个时候就需要用camera自定义扫描界面;camera文档传送门   效果图:(需要获取camera授权权限)代码:<vi......
  • MeterSphere BeanShell 前后置脚本如何引用自定义 Jar 包
    需求接口测试中需要对post请求的body参数进行排序后,进行md5加密,生成sign字符串,放入请求体中提交。思路:在前置脚本中自动获取请求参数中的值,进行sign加密,生......
  • RDLC后台自定义报表模板
    首先封装一个公共类,统一来操作RDLC报表usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingSystem.Web;usingSystem.Xml;usingSystem.Data;usingMi......
  • 小程序自定义底部导航 custom-tab-bar
    1.app.json     2.将custom-tab-bar放到根目录下(pages同级)3. custom-tab-bar 代码{"component":true}Component({data:{USERTYPE:'cu......
  • spring源码 自定义beanDefinition的添加逻辑
      首先我自定义了两个beandefinition,第一个会产生第二个,并且都是特殊的实现,能够避开前面的循环读取,所以,spring在最后用了一个while循环,一个flag就将,beandefinition新增......
  • 自定义RBAC(1)
    您好,我是湘王,这是我的51CTO博客,欢迎您来,欢迎您再来~在对Spring Security稍做了解之后,可以知道,SpringSecurity其实只是一个实现认证授权的框架,封装了很多实现细节。但也有一......