首页 > 其他分享 >ES聚合查询详解(一)

ES聚合查询详解(一)

时间:2022-12-07 17:42:08浏览次数:32  
标签:聚合 name 查询 field 详解 aggs my ES


前言

本文主要介绍ES中的聚合查询。


一、聚合查询简介

聚合查询可以将数据汇总为度量、统计或其他分析。

聚合查询主要分为三个类别:

  • Metric 指标聚合
  • Bucket 桶聚合
  • Pipeline 管道聚合

二、聚合函数的使用

1、如何运行一个聚合查询

GET /my-index-000001/_search
{
"aggs": {
"my-agg-name": {
"terms": {
"field": "my-field"
}
}
}
}

说明:
​​​aggs​​​ 说明采用的是聚合查询
​​​my-agg-name​​​ 是聚合查询的名称
​​​terms​​​ 说明采用的是Terms aggregation多值聚合:一个基于多桶值源的聚合,其中桶是动态构建的——每个唯一值一个桶。统计每个唯一值的个数。
​​​field​​ 指定需要统计的字段。

2、限制聚合查询的范围

GET /my-index-000001/_search
{
"query": {
"range": {
"@timestamp": {
"gte": "now-1d/d",
"lt": "now/d"
}
}
},
"aggs": {
"my-agg-name": {
"terms": {
"field": "my-field"
}
}
}
}

3、仅返回聚合结果

默认情况下,包含聚合的查询会同时返回搜索命中的结果和聚合结果。若要只返回聚合结果,请将大小设置为0

GET /my-index-000001/_search
{
"size": 0,
"aggs": {
"my-agg-name": {
"terms": {
"field": "my-field"
}
}
}
}

4、运行多个聚合

GET /my-index-000001/_search
{
"aggs": {
"my-first-agg-name": {
"terms": {
"field": "my-field"
}
},
"my-second-agg-name": {
"avg": {
"field": "my-other-field"
}
}
}
}

5、子聚合

统计索引中my-field字段的每个唯一值的记录数,并计算每组记录中my-other-field字段的平均值。
典型的场景:先分组,再计算

GET /my-index-000001/_search
{
"aggs": {
"my-agg-name": {
"terms": {
"field": "my-field"
},
"aggs": {
"my-sub-agg-name": {
"avg": {
"field": "my-other-field"
}
}
}
}
}
}

执行结果:

{
...
"aggregations": {
"my-agg-name": {
"doc_count_error_upper_bound": 0,
"sum_other_doc_count": 0,
"buckets": [
{
"key": "foo",
"doc_count": 5,
"my-sub-agg-name": {
"value": 75.0
}
}
]
}
}
}

6、聚合查询中使用scripts脚本

采用script脚本提取运行时字段,并对运行时字段message.length进行聚合。

GET /my-index-000001/_search?size=0
{
"runtime_mappings": {
"message.length": {
"type": "long",
"script": "emit(doc['message.keyword'].value.length())"
}
},
"aggs": {
"message_length": {
"histogram": {
"interval": 10,
"field": "message.length"
}
}
}
}

7、聚合结果分页

GET /my-index-000001/_search
{
"size":0,
"aggs" : {
"group_account" : {
"terms" : {
"size": 2,
"field" : "account",
"order": {
"sum_gmv" : "desc"
}
},
"aggs": {
"sum_gmv": {
"sum": {"field": "bus_ep_gmv"}
}
}
}
}
}

8、聚合查询缓存说明

为了获得更快的响应,Elasticsearch 将频繁运行的聚合结果缓存到切分请求缓存中。
若要获取缓存结果,请对每次搜索使用相同的首选项字符串。
如果您不需要搜索命中、只返回聚合结果,请将大小设置为0,以避免填充缓存。


总结

本文主要是聚合查询进行了简单的介绍。
1、聚合查询主要使用场景:数据的统计分析。
2、聚合查询主要分为三个类别:

  • Metric 指标聚合
  • Bucket 桶聚合
  • Pipeline 管道聚合

3、聚合查询的简单使用示例。


标签:聚合,name,查询,field,详解,aggs,my,ES
From: https://blog.51cto.com/u_15905482/5919820

相关文章

  • ES聚合查询详解(三):指标聚合
    前言ES聚合查询主要分为3类:指标聚合、桶聚合和管道聚合。本文主要是介绍其中指标聚合的相关使用。一、简介指标聚合​​MetricsAggregations​​如果说​​桶聚合主要是......
  • ES中复杂DSL查询语句不会写怎么办?
    前言刚接触ES不久的同学一定都遇到过这样的问题,复杂的查询场景下不知道怎么写DSL查询语句,今天教大家一个小妙招,解决复杂DSL语句不会写的问题。一、来吧,展示巧用大招:ES7以......
  • Mysql连接查询详解
    前言记得刚工作几年的时候,就写了一篇关于Mysql连接查询的博客文章,里面简单的认为先对关联表的记录进行笛卡尔积,然后再根据where条件过滤,现在看来有点贻笑大方了。正好最近看......
  • logback性能优化详解
    前言不正确的日志打印不但会降低程序运行性能,还会占用大量IO资源和硬盘存储空间。本文主要总结一些能提高日志打印性能的手段。一、通过AsyncAppender异步输出日志我们通常......
  • logback异步输出日志详解
    前言logback应该是目前最流行的日志打印框架了,毕竟SpringBoot中默认的集成的日志框架也是logback。在实际项目开发过程中,常常会遇到由于打印大量日志而导致程序并发降低,QPS......
  • 通过Logstash实现mysql数据定时增量同步到ES
    文章目录​​前言​​​​一、系统配置​​​​二、同步步骤整体概览​​​​三.logstash数据同步实战​​​​1、新建mysql表​​​​2、ES中新建索引​​​​3、Logstash......
  • mybatis一级缓存和二级缓存使用详解
    文章目录​​一、概念说明​​​​1、一级缓存​​​​2、二级缓存​​​​3、比较​​​​二、mybatis缓存的生命周期​​​​三、一级缓存的使用​​​​四、二级缓存的使......
  • mybatis-plus雪花算法生成Id使用详解
    文章目录​​前言​​​​一、mybatis-plus官网​​​​二、雪花算法实战​​​​1.建表​​​​2.新建测试工程​​​​3.单元测试​​​​三、实现分析​​​​四、为什么......
  • Mybatis-Plus字段策略FieldStrategy详解
    文章目录​​前言​​​​一、官方文档​​​​二、字段策略介绍​​​​1、FieldStrategy作用​​​​2、FieldStrategy类型​​​​3、FieldStrategy配置​​​​全局策略......
  • cesium加载倾斜摄影,添加billboard并注册点击事件
       完整示例代码如下:<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><title>天地图</title><!--引用cesium的js和css,天地图的扩展js--......