自带分词器

自带分词器

时间：2022-10-09 22:14:43浏览次数：41

标签：end start token 分词器 offset position 自带 type

Standard - 默认分词器，按词切分支持多语言，并小写处理
Simple - 非字母切分, 小写处理（UU-a 切成 uu,a doni`t 切成 doni 和 t）
Stop - 小写处理，停用词过滤(the,a,is,2)
Whitespace - 按照空格切分，不转小写
Keyword - 不分词，直接将输入当作输出
pattern - 通过正则自定义分隔符，默认是 \W+,即非词符号分割

POST _analyze
{
  "analyzer": "standard",
  "text": "the sadf ss 2 Aeis"
}

{
  "tokens": [
    {
      "token": "the",
      "start_offset": 0,
      "end_offset": 3,
      "type": "<ALPHANUM>",
      "position": 0
    },
    {
      "token": "sadf",
      "start_offset": 4,
      "end_offset": 8,
      "type": "<ALPHANUM>",
      "position": 1
    },
    {
      "token": "ss",
      "start_offset": 9,
      "end_offset": 11,
      "type": "<ALPHANUM>",
      "position": 2
    },
    {
      "token": "2",
      "start_offset": 12,
      "end_offset": 13,
      "type": "<NUM>",
      "position": 3
    },
    {
      "token": "aeis",
      "start_offset": 14,
      "end_offset": 18,
      "type": "<ALPHANUM>",
      "position": 4
    }
  ]
}

标签：end,start,token,分词器,offset,position,自带,type
From： https://www.cnblogs.com/mister-liu/p/16773863.html

Win10自带的备份工具备份系统
Windows操作系统经过从win98,win2000,winxp,win7,win8到win10的不断更新和完善，功能已经非常强大、完备了。但伴随着微软把重点转移到云端，对更新维护不再保留专门的......
es索引、类型（mapping）、文档、ik分词器
一、概念1、初学可以把es看作数据库可以建立索引（库）文档（库中的数据）2、es是面向文档的，一切都是json3、物理设计es后台把每个索引划分成多个分片，每份分片可以在集群中的不同......
jvm 自带调优工具一览
jdk在安装的时候会提供一些性能分析、故障诊断、JVM监控之类的工具，了解这些工具对我们分析JVM内存、JVM调优有一定的帮助，本篇文章来学习一下。监控类工具jpsjps(JVMProcess......
04-Elasticsearch-ES集成IK分词器
分词器分词器汇总分词器拆分方式standard空格simple非字母whitespace空格stop去除英文的助词(atheis)keyword不拆分......
WPF开发经验-实现自带触控键盘的TextBox
一引入项目有个新需求，当点击或触碰TextBox时，基于TextBox的相对位置，弹出一个自定义的Keyboard，如下图所示：二KeyboardControl先实现一个自定义的KeyboardControl，它继......
【青春不老 6.1快乐】WIN10自带互联网远程控制利器
尊重原创勿抄袭勿私放其他平台2020.6.1星期一在这样一个欢乐的日子里，剑指工控恭祝所有小朋友、大朋友们儿童节快乐！愿我们所有工控人的小朋友们幸福、健康成长！愿我们所有工......
docker集成分词器时报Caused by: java.nio.file.FileSystemException: /usr/share/ela
官网https://github.com/medcl/elasticsearch-analysis-ik/releases/tag/v6.8.6下载好的zip包cp到/usr/share/elasticsearch/plugins/下后解压它会带有一个config包，或者......
Servicemonitor监控自带metrics接口和无metrics接口
前言：servicemonitor监控存在两种情况：1、有metrics，创建service+servicemonitor配置2、无metrics 配置exporter，exporter进行采集一、监控自带metrics接口①、部署......
springboot中使用mybatisplus自带插件实现分页
springboot中使用mybatisplus自带插件实现分页1.导入mybatisplus分页依赖<dependency><groupId>com.baomidou</groupId><artifactId>mybatis-......
直播平台开发，自带干扰线的js随机验证码
直播平台开发，自带干扰线的js随机验证码 <!DOCTYPEhtml><html><head> <metacharset="UTF-8"> <metaname="viewport"content="width=device-width,initial......

相关文章

赞助商

阅读排行