es索引、类型（mapping）、文档、ik分词器

时间：2022-10-09 15:04:55浏览次数：86

标签：word max mapping 索引 ik 分词器分词 es

一、概念

1、初学可以把es看作数据库可以建立索引（库）文档（库中的数据）

2、es是面向文档的，一切都是json

es索引、类型（mapping）、文档、ik分词器_搜索

3、物理设计

es后台把每个索引划分成多个分片，每份分片可以在集群中的不同服务器间迁移，一个默认就是一个集群默认集群名称elaticsearch

4、逻辑设计

es索引、类型（mapping）、文档、ik分词器_搜索引擎_02

es索引、类型（mapping）、文档、ik分词器_搜索引擎_03

es索引、类型（mapping）、文档、ik分词器_java_04

es索引、类型（mapping）、文档、ik分词器_大数据_05

es索引、类型（mapping）、文档、ik分词器_java_06

es索引、类型（mapping）、文档、ik分词器_大数据_07

二、ik分词器

1、概述

把一段中文分成一个个关键字，搜索的时候根据关键信息搜索，会把数据库中或者索引中的数据进行分词，默认中文分词是将每一字都看成一个词，比如我爱中国分成‘我’ ‘爱’ ‘中’‘国’显然有问题，所以安装中文分词器解决这个问题

ik提供了ik_smart和ik_max_word,其中ik_smart为最少切分，ik_max_word最细粒度划分

2、安装

地址

Releases · medcl/elasticsearch-analysis-ik · GitHub

注意版本和es一致

下载完成解压到es的plugis插件文件下的ik（自己创建）文件夹下，并删除压缩包

查看，进入es bin目录执行

D:\es\elasticsearch-7.14.0\bin>elasticsearch-plugin list
"warning: usage of JAVA_HOME is deprecated, use ES_JAVA_HOME"
Future versions of Elasticsearch will require Java 11; your Java version from [D:\Java\jdk1.8.0_131\jre] does not meet this requirement. Consider switching to a distribution of Elasticsearch with a bundled JDK. If you are already using a distribution with a bundled JDK, ensure the JAVA_HOME environment variable is not set.
ik

3、使用kibana测试

GET _analyze
{
  "analyzer": "ik_smart",
  "text": "中国共产党"
}

GET _analyze
{
  "analyzer": "ik_max_word",
  "text": "中国共产党"
}

GET _analyze
{
  "analyzer": "ik_max_word",
  "text": "java一号中国共产党"
}

没有‘java一号’，这种需要自己自定义dic分词

ik目录下配置

es索引、类型（mapping）、文档、ik分词器_搜索引擎_08

再次测试完成

总结：项目中的搜索功能我们只需定义自己的分词dic文件就行

标签：word,max,mapping,索引,ik,分词器,分词,es
From： https://blog.51cto.com/u_11334685/5740470

python 循环调用问题most likely due to a circular import的解决方法
网上看了很多资料都无法解决，如修改class的名字，无法解决；看了一遍帖子是与import内存执行顺序有关系解决方法：在局部使用位置进行import调用 ......
实现企业内部知识流通？搭建企业内部Wiki
wiki是一种协同工作平台，也就是开放的编辑系统。我们可以使用Wiki构建帮助系统、知识库系统.国内出名的公共wiki是百度百科；在这里，我将谈论企业内部的wiki。企业wiki，员工可以......
界面控件Telerik R3 2022新版亮点 - 全新的ThemeBuilder工具
TelerikDevCraft包含一个完整的产品栈来构建您下一个Web、移动和桌面应用程序。它使用HTML和每个.NET平台的UI库，加快开发速度。TelerikDevCraft提供最完整的工具箱，用于构......
Oracle正则表达式函数：regexp_like、regexp_substr、regexp_instr、regexp_replace
Oracle使用正则表达式离不开这4个函数：1、regexp_like2、regexp_substr3、regexp_instr4、regexp_replace看函数名称大概就能猜到有什么用了。regexp_like只能用于条件表达......
ES Mapping
映射是定义如何存储和索引一个文件及其包含的字段的过程。每个文档都是一个字段的集合，每个字段都有自己的数据类型。当映射你的数据时，你创建一个映射定义，其中包含一个与文......
玩转华为ENSP模拟器系列 | 两个网关之间通过IKE方式协商IPSec VPN隧道（采用预共享密钥
素材来源：华为防火墙配置指南一边学习一边整理试验笔记，并与大家分享，侵权即删，谢谢支持！附上汇总贴：玩转华为ENSP模拟器系列|合集_COCOgsta的博客-CSDN博客_华为模拟器实验......
对于Servlet原理以及Mapping的五种映射和404页面的详解
一.Servlet原理1,浏览器向web容器发送Http请求，我们这里用的web容器为tomcat。2.我们在Servlet里的protectedvoiddoGet(HttpServletRequestreq,HttpServletResponsere......
P1823 [COI2007] Patrik 音乐会的等待
用单调队列维护即可，注意要考虑高度相同的情况（可以记录单调队列中相同的个数）。时间复杂度为\(O(n)\)。#include<bits/stdc++.h>usingnamespacestd;#defineintlong......
CF 547D. Mike and Fish 题解
Solution1二分图染色显然这题是构造染色方案，于是我们考虑将矩阵转化成图进行染色。结论：将同一行的点两两配对，将同一列的点两两配对，形成的一定是二分图。证明：由于每......
springboot项目报错No mapping for GET /css/bootstrap.css，前端无法展示样式
说来也奇怪，前几天刚写完的项目写的好好的现在打开他就加载不了前端的静态资源了报错NomappingforGET/css/bootstrap.css解决方法：新建一个配置类，将静态资源的路径......