首页 > 其他分享 >es笔记五之term-level的查询操作

es笔记五之term-level的查询操作

时间:2023-05-18 23:32:15浏览次数:45  
标签:term exam level 查询 搜索 address query es

本文首发于公众号:Hunter后端 原文链接:es笔记五之term-level的查询操作

官方文档上写的是 term-level queries,表义为基于准确值的对文档的查询,可以理解为对 keyword 类型或者 text 类型分词为 keyword 的字段进行 term 形式的精确查找。

以下是本篇笔记目录:

  1. 是否存在值
  2. 前缀搜索
  3. 大小于操作
  4. term 查询
  5. terms 查询
  6. wildcard 查询

1、是否存在值

exists 查询某个字段是否存在值。

还是使用上篇笔记讲的 exam 这个 index,我们创建一条数据,只给定 name 的值,那么 address 的值就 null,或者说查询返回的数据就没有这个字段了。

PUT /exam/_doc/12
{
    "name" : "test"
}

然后我们查询 address 字段有值的数据:

GET /exam/_search
{
  "query": {
    "exists": {
      "field": "address"
    }
  }
}

就可以发现返回的数据中没有我们创建的这条数据,或者我们取反操作,查询 address 字段没有值的数据:

GET /exam/_search
{
  "query": {
    "bool": {
      "must_not": [
        {"exists": {"field": "address"}}
      ]
    }
  }
}

2、前缀搜索

对于我们在前面创建的这条数据:

PUT /exam/_doc/16
{
    "name" : "张三丰",
    "address": "一个苹果"
}

如果是 name 字段,因为它是一个 keyword 类型,所以它是一个整体不会被分词处理,我们可以搜索 name 的值为 '张', '张三' 和 '张三丰' 都可以搜索到。

GET /exam/_search
{
  "query": {
    "prefix": {
      "name": {
        "value": "张"
      }
    }
  }
}

但是对于 address 字段,发现是可以搜索到 '一','一个' 和 '苹果',但是搜索 '一个苹',或者 '一个苹果' 是搜不到结果的。

GET /exam/_search
{
  "query": {
    "prefix": {
      "address": {
        "value": "一个苹"
      }
    }
  }
}

我们可以看一下 '一个苹果' 的分词结果:

GET /exam/_doc/16/_termvectors?fields=address

可以发现可以搜索到的词都在以分词结果的开头或者全部,但是 '一个苹' 是没有分词结果以此为开头的。

所以这里我们的搜索操作是基于 address 字段的分词结果列表来查询的。

如果想要搜索到从 '一' 开始到结尾之间任意地点截断的数据,我们就需要将 address 字段作为一个整体来搜索,那就是加上 .keyword 来操作。

GET /exam/_search
{
  "query": {
    "prefix": {
      "address.keyword": {
        "value": "一个苹"
      }
    }
  }
}

3、大小于操作

前面介绍了 gt, gte, lt, lte 的操作是在 bool 下的 filter 里操作,这里我们可以直接放到 query 下:

GET /bank/_search
{
  "query": {
    "range": {
      "age": {
        "gte": 10,
        "lte": 20
      }
    }
  }
}

4、term 查询

前面介绍过 term 查询是一种精确查询,但是官方文档提醒我们应该尽量避免对 text 字段使用 term 查询,因为 text 类型的数据在写入的时候会被分词,通过 term 查询我们可能搜索不到想要的查询的数据。同时建议我们查询 text 字段应当使用 match 操作。

我们使用官方文档提供的一个示例来说明为什么应该尽量避免使用 term 查询来查询 text 字段,其实前面我们介绍过相关的示例,这里单独拿出来做一下说明。

还是使用我们前面用过的索引 exam,我们来写入一条数据:

PUT /exam/_doc/18
{
  "address": "quick brown foxes"
}

然后我们想要搜索 'quick brown foxes' 这个字符串,使用下面的操作:

GET /exam/_search
{
  "query": {
    "term": {
      "address": {
        "value": "quick brown foxes"
      }
    }
  }
}

这个肯定是搜索不到的,因为这个字符串在写入的时候已经被分词处理了,而 term 是一个精确查找,相当于搜索一整个字符串,这就肯定搜索不到了。

但是我们可以使用 match,match 操作会在搜索前先对搜索的字符串进行分词处理,然后进行匹配操作,所以使用下面的操作是可以搜索到数据的:

GET /exam/_search
{
  "query": {
    "match": {
      "address": "quick brown foxes"
    }
  }
}

前面还介绍过,如果想要搜索一整个 address 的值为我们搜索的字符串内容,可以使用 address.keyword:

GET /exam/_search
{
  "query": {
    "term": {
      "address.keyword": "quick brown foxes"
    }
  }
}

5、terms 查询

如果想要同时搜索多个精确字段值,比如搜索 "quick" 和 "苹果",就可以使用 terms:

GET /exam/_search
{
  "query": {
    "terms": {
      "address": ["quick", "苹果"]
    }
  }
}

6、wildcard 查询

wildcard 是通配符的意思,这里的用法有点类似于前缀的操作,都是通过符号来实现更为随意的匹配。

这里有两个通配符,一个是 *,一个是 ?

* 的作用是 0 到 n 个字符长度

比如我搜索 qui* 就可以查到 quick 的数据:

GET /exam/_search
{
  "query": {
    "wildcard": {
      "address": {
        "value": "qui*"
      }
    }
  }
}

? 的作用是匹配任意单个字符,比如我们搜索 qui?k,也可以查询到这条数据:

GET /exam/_search
{
  "query": {
    "wildcard": {
      "address": {
        "value": "qui?k"
      }
    }
  }
}

标签:term,exam,level,查询,搜索,address,query,es
From: https://blog.51cto.com/u_16061969/6307777

相关文章

  • 「CF1718E」Impressionism
    题目点这里看题目。Burenka有两张图片$a$和$b$,它们的大小可以表示为$n\timesm$的像素组合。每幅画的每个像素都有一个颜色——表示为一个从$0$到\(2\times10^5\)的数字,并且在两幅画的每一行或每一列中都没有重复的颜色,除了颜色$0$。Burenka想把图片\(......
  • ZCL_REST_CLIENT
    IntroductionHistoryPublicMethodHANDLE_REQUESTProtectedMethod_HANDLE_REQUESTSample建立RESTfulAPIClass設定API路徑LogsAppendixSMICM各環境HostName,PortIntroductionZCL_REST_CLIENTRESTful-APIconsumerenhancement-自動記錄reque......
  • ZCL_REST_SERVER
    IntroductionHistoryPublicMethodIF_HTTP_EXTENSION~HANDLE_REQUESTProtectedMethod_HANDLE_REQUESTSample建立RESTful-APIClass設定API路徑LogsAppendixSMICM各環境HostName,PortIntroductionZCL_REST_SERVERRESTful-APIproviderenhanceme......
  • ZCL_REST_SYSTEM_MONITOR
    IntroductionHistorySwaggerIntroductionClass:ZCL_REST_SYSTEM_MONITOR利用zcl_tools=>get_system_monitor(),給外部取得SAP系統狀況HistoryVersionDateNameDescriptionV0012021/10/13HuangRoy初版SwaggerItemURLSwaggerUIhttp://tao-misdb......
  • es笔记一之es安装与介绍
    本文首发于公众号:Hunter后端原文链接:es笔记一之es安装与介绍首先介绍一下es,全名为Elasticsearch,它定义上不是一种数据库,是一种搜索引擎。我们可以把海量数据都放到es里然后提供搜索操作,但是MySQL也同样可以提供搜索,为什么要用es呢?一个是因为它搜索快,使用倒排索引的......
  • [ABC268C] Chinese Restaurant
    [ABC268C]ChineseRestaurant声明:以下的所有操作都会再做一次\(\%n+n)\%n\),比如\(i-1\)会变成\(((i-1)\%n+n)\%n\)题意有\(n\)个人和\(n\)个盘子,每个人如果能拿到\(i-1\)或\(i\)或\(i+1\)号盘子那么他会很开心,现在每个人的站位是\(p_i\),他们的站位位......
  • 08_TypeScript 循环
    08_TypeScript循环有的时候,我们可能需要多次执行同一块代码。一般情况下,语句是按顺序执行的:函数中的第一个语句先执行,接着是第二个语句,依此类推。编程语言提供了更为复杂执行路径的多种控制结构。for循环TypeScriptfor循环用于多次执行一个语句序列,简化管理循环变量的代码......
  • Vue Ant Design Pro 中定制主题
    VueAntDesignPro中定制主题需求定制主题去除“正在切换主题”过渡效果 需求项目要求使用草绿色的主题色并且去除如下的loading效果定制主题这里可以参照AntDesignProofVue官方文档哦定制方式是使用 less 的modifyVars的方式进行覆盖变量官方文档......
  • Python爬虫学习之Requests库
    Requests请求库Requests是⽤Python语⾔编写,基于urllib,采⽤Apache2Licensed开源协议的HTTP库。它⽐urllib更加⽅便,可以节约我们⼤量的⼯作,完全满⾜HTTP测试需求。⼀句话——Python实现的简单易⽤的HTTP库1.了解requests库requests库的介绍requests是一个优雅而简单的Py......
  • AtCoder Regular Contest 124 F Chance Meeting
    洛谷传送门AtCoder传送门感觉挺高妙的……为了方便,不妨把横纵坐标都整体减\(1\)。如果单独考虑上下移动,方案数是\(\binom{2n}{n}\)。发现两个人上下总共移动\(n\)次后一定会在同一行,设这行编号为\(x\),那么最后带个\(\binom{n}{x}^2\)的系数,并且除掉上下移动后方案本质......