首页 > 其他分享 >es-analysis模块学习总结

es-analysis模块学习总结

时间:2023-06-17 16:12:25浏览次数:39  
标签:... 分析器 analysis 单词 模块 es

什么是 Analysis

顾名思义,文本分析就是把全文本转换成一系列单词(term/token)的过程,也叫分词。在 ES 中,Analysis 是通过分词器(Analyzer) 来实现的,可使用 ES 内置的分析器或者按需定制化分析器。

举一个分词简单的例子:比如你输入 Mastering Elasticsearch,会自动帮你分成两个单词,一个是 mastering,另一个是 elasticsearch,可以看出单词也被转化成了小写的。

analysis模块也是es索引的关键模块,在索引和检索的过程中都会使用到这个模块,尤其是需要根据业务场景自定义的情形

 

 

 

PUT /my_index
{
    "settings": {
        "analysis": {
            "char_filter": { ... 字符过滤器 ... },
            "tokenizer":   { ...   分词器    ... },
            "filter":      { ...   词单元过滤器   ... },
            "analyzer":    { ...   分析器      ... }
        }
    }
} 

 

标签:...,分析器,analysis,单词,模块,es
From: https://www.cnblogs.com/sunnycc/p/17487597.html

相关文章

  • Educational Codeforces Round 150 (Rated for Div. 2) C. Ranom Numbers
    #include<iostream>#include<string>#include<cstring>#include<algorithm>#include<cmath>usingnamespacestd;constintN=2e5+10;typedeflonglongll;//记录每个字母的最前面的位置和最后面的位置intFast[5],End[5];strings,c;llres=-0x3......
  • GESP-C++-2
    GESPC++二级样题卷人们在使用计算机时所提到的Windows通常指的是()。A.操作系统B.多人游戏C.上市公司D.家居用具答案:A万维网WWW中存储了海量的数据资源,这里用于传输控制的协议是()。A.URLB.SMTPC.HTTPD.HTML答案:C下列关于C++语言的叙述,不正确的是()......
  • macOS 安装 postgreSQL
    PostgreSQLDocumentationbrewinstallpostgresqlbrewservicesstartpostgresqlcreatedb#Bydefault,adatabasewiththesamenameasthecurrentuseriscreated.#dropdbpsql......
  • python unitest 测试装置(Test Fixture)
    unittest框架提供了测试装置(TestFixture)的功能,用于在测试用例执行前后进行准备和清理操作。测试装置包括setUp()方法和tearDown()方法,分别用于在每个测试用例执行前和执行后进行相应的操作。下面是一个示例,演示如何使用测试装置:importunittestclassMyTestCase(unittest.Te......
  • Models, Mappings, Request Validation Notes
    RequestValidationAPIGatewaycanperformbasicvalidation.Thisenablesyou,theAPIdeveloper,tofocusonapp-specificdeepvalidationinthebackend.YoucanoffloadbasicvalidationtoAPIGateway.Forthebasicvalidation,APIGatewayverifieseith......
  • python unitest 测试运行器(Test Runner)
    测试运行器(TestRunner)是unittest框架提供的执行测试用例的组件,用于自动运行测试用例并生成测试结果报告。它负责加载测试用例、执行测试用例,并提供测试结果的输出。unittest框架提供了多种测试运行器,包括TextTestRunner、HTMLTestRunner、XMLTestRunner等。这些运行器可以根据不......
  • stress模拟系统负载较高时的场景
    #!/bin/bash#获取网卡名称network_adapter=`ipa|grep"BROADCAST"|awk'{print$2}'|awk-F:'{print$1}'`functionNet_speed_limiting{#输入提示read-p"PleaseinputNetspeedlimitingrate(kbit):"Net_raterea......
  • python unitest 测试套件TestSuite()
    unittest框架提供了多种测试套件的使用方法,用于组织和执行测试用例。以下是一些常见的测试套件使用方法及其示例:1.使用unittest.TestSuite()创建测试套件,然后使用addTest()方法添加测试用例。importunittestclassMyTestCase(unittest.TestCase):deftest_addition(self):......
  • python unitest测试用例
    unittest框架的测试用例有三种常见的写法:函数式、类式和装饰器式。函数式写法:importunittestdeftest_sum(self):result=sum([1,2,3])self.assertEqual(result,6)if__name__=='__main__':unittest.main() 注意事项:使用函数式写法时,测......
  • What is API Gateway Notes, API Driven Dev Notes
    APIDrivenDevelopmentWhatisAPIDrivenDevelopment?APIDrivenDevelopmentisaprocessthatallowsdeveloperstofocusonAPIdesignbeforewritingcode.Theideais,beforeyoustartwritingyoursoftware,youfirstdesignandagreeonwhattheAPIw......