首页 > 其他分享 >使用docker命令行为elasticsearch安装ik中文分词插件

使用docker命令行为elasticsearch安装ik中文分词插件

时间:2023-10-19 23:23:37浏览次数:30  
标签:插件 分词 ik elasticsearch docker 7.8

背景:mac + docker desktop + elasticsearch 7.8.0

 

一、安装ik中文分词插件

docker exec -it elastic_search /bin/bash -c 'bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.8.0/elasticsearch-analysis-ik-7.8.0.zip'

 

注意:这里我们使用的ik插件的版本也是7.8.0,主要目的是因为elasticsearch的版本是7.8.0,我们为了避免出现不兼容,这里特意选择版本一致,你也可以选择新版本的ik插件进行安装测试。

 

二、重启elasticsearch

docker restart elastic_search

 

三、测试ik分词效果

curl -X GET "http://localhost:9200/_analyze" -H 'Content-Type: application/json' -d'
   {
     "analyzer": "ik_smart",
     "text": "我爱自然语言处理"
   }'

 

四、存在的问题

步骤三的例子,看起来分词效果还不错,但是在我看来还是存在不少问题,你可以换个句子,把同样的简体句子换成繁体,比如:

这家餐厅很差,环境也很差,服务态度也很差,不推荐!
這家餐廳很差,環境也很差,服務態度也很差,不推薦!
再次观察ik对这段话的分词结果,就我个人而言,这次的分词效果并没有达到我的预期,使用mysql分词、jieba分词,还有其他分词库,得到的分词结果都不尽如人意,这说明目前开源的分词插件还是有很大改进空间,感兴趣的朋友可以自行研究。

 

标签:插件,分词,ik,elasticsearch,docker,7.8
From: https://www.cnblogs.com/jamstack/p/17775959.html

相关文章

  • ai提效编程插件BoitT
    ai提效编程插件BoitT一、Boit安装1、安装在idea中依照路径Preferences->Plugins,在搜索框中输入“Bito”,然后点击“Search”按钮,然后安装2、Boit注册安装成功,选中一段代码,右键,出现随便选择一个功能就会进入注册界面填完邮箱后收到验证码再填写现在还需要写名字,但是......
  • elasticsearch 设置高亮
    1、引入配置springboot环境<parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>2.3.2.RELEASE</version></parent>引入es配置<!--e......
  • 好用的代码高亮插件
    获取地址:Download▲Prism(prismjs.com)使用方法:<preclass="line-numbers"><codeclass="language-Python">deftest():<br>    print("123")</code></pre>......
  • jemeter插件管理及jp@gc - PerfMon Metrics Collector插件安装
    插件管理安装地址:下载地址在可用插件选项中找到下面的插件(我是已经安装了):安装需要联网,安装后提示重启,重启就能使用了: 添加两个监控选项: 启动ServerAgent: 然后可用开始进行测试,如果一运行ServerAgent就退出的话,见:解决方法 ......
  • 使用 kaniko 在 K8S 中构建镜像
    背景现有个需求需要在K8S中构建一个新的镜像,之前使用docker命令进行构建,后面K8S升级,容器运行时换成了containerd,故查了一下网络,发现kaniko比较好用。所以测试记录一下~项目地址:https://github.com/GoogleContainerTools/kaniko测试例子一:mkdir-p/data/yaml/default......
  • Elasticsearch 7.17.7开启x-pack
    1、ES配置文件  elasticsearch.ymlcluster.name:elasticsearchnode.name:node-1network.host:0.0.0.0discovery.type:single-nodexpack.security.enabled:truexpack.security.authc.api_key.enabled:true设置密码/usr/share/elasticsearch/bin/elasticsearch-s......
  • ArthasHotSwap插件使用
    ArthasHotSwap插件使用1、安装插件2、指定服务器上需要热部署的java进程因为服务器上可能不止一个java进程,如果不指定进程,热更会新默认更新第一个3、反编译字节码运行arthasjava-jararthas-boot.jar选择java进程查看正在使用的类jadcom.ruoyi.race.service.impl......
  • 两种方法,轻松完成 Telerik Reporting REST 服务和报表服务器的切换!
    TelerikReporting拥有直观、无代码的Win、网页与PDF报表的创建功能,直观的设计与具有特定风格的报表,无代码数据打包、向导、语法开发工具、自动操作。分类整理、过滤、有条件格式化、转化器格式,活动报表,水晶报表,附加报表。本文主要目的是展示在这两种呈现报表的方法(TelerikRepo......
  • 【JDK】自定义注释处理程序插件 AbstractProcessor
    1 前言最近比较好奇,Lombok、MapStruct里的注解,会在打包的时候会给我们的字节码文件里,写入一些东西甚至生成一些转换的字节码文件,不知道人家是如何做到的,所以抽空看了看,自己写了一个小Demo,来体验下。我们的目标就是引入自己的 AbstractProcessor的maven依赖包,然后能给我们生......
  • Pika v3.5.1发布!
    Pika社区很高兴宣布,我们今天发布已经过我们生产环境验证v3.5.1版本,https://github.com/OpenAtomFoundation/pika/releases/tag/v3.5.1 。该版本不仅做了很多优化工作,还引入了多项新功能。这些新功能包括动态关闭WAL、ReplicationID检测是否增量复制、在K8s环境上......