首页 > 其他分享 >ELK-内置分词器-simple_pattern分词器

ELK-内置分词器-simple_pattern分词器

时间:2022-08-22 22:01:56浏览次数:55  
标签:ELK tokenizer simple pattern analyzer 分词器 my

一.simple_pattern分词器 simple_pattern分词器是根据正则表达式进行分词的分词器

#创建映射并定义字段内容分词的正则表达式
#正则表达式表示,如果连续有3个数字在一起,则可以被当作一个单词
PUT myindex-simple_pattern
{
    "settings":
    {
        "analysis":
        {
            "analyzer":
            {
                "my_analyzer":
                {
                    "tokenizer":"my_tokenizer"                
                }          
            },
            "tokenizer":
            {
                   "my_tokenizer":
                   {
                       "type":"simple_pattern",
                       "pattern":"[0123456789]{3}"                   
                   }         
             }                 
        }    
    }
}

#对指定内容根据"myindex-simple_pattern"分词器进行分词
POST myindex-simple_pattern/_analyze
{
     "analyzer":"my_analyzer",
     "text":"fd-123-4567-890-xxd9-689-x987"
}
可以看到"fd-123-4567-890-xxd9-689-x987"被分成了5关键字,分词之后的结果如下 ["123","456","890","689","987"]

 


 

标签:ELK,tokenizer,simple,pattern,analyzer,分词器,my
From: https://www.cnblogs.com/menglin2010/p/16614399.html

相关文章

  • ELK-内置分词器-simple分词器
    一.simple分词器simple分词器是对字母文本进行分词拆分,并将分词后的内容转换成小写格式#对指定内容根据"simple"分词器进行分词POST_analyze{"analyzer":"simple"......
  • SimpleDateFormat 时间格式化
    newDate()后,使用SimpleDateFormat进行格式转换时,该函数的参数需要注意大小写,大小写不同,转换出的时间不同。如yyyy-MM-ddhh:mm:ss与yyyy-mm-ddhh:mm:ss转换后的结果......
  • ik分词器安装步骤
    1.在github中打开ik分词器  2.打开Release界面找到相应的发行版  3.下载相应的发行版(如果下载的是Sourcecode.zip则要进入项目目录,进行编译打包mvnclean=>......
  • 博客园定制皮肤教程_Cnblogs-Theme-SimpleMemory
    目录前言链接参考笔录草稿步骤1.注册博客园2.申请开通博客园3.申请支持JS权限4.配置皮肤做好以上步骤后,开始源码配置前言记录博客园皮肤设置。链接皮肤源码及......
  • Docker/Docker Compose部署ELK
    目录Docker/DockerCompose部署ELKDocker下安装ELKDockerCompose部署ELK准备工作相关文件结构修改系统的vm.max_map_count安装和配置ELK服务获取sebp/elk的原始配置文件编......
  • 在 Ubuntu18.04集成Zeek与ELK
    Elasticsearch:一个分布式RESTful搜索引擎,用于存储所有收集的数据。Logstash:ElasticStack的数据处理组件,用于将传入数据发送到Elasticsearch。Kibana:用于搜索和可视......