首页 > 数据库 >POSTGRESQL SQL 优化,不建立索引,不调整参数,不修改SQL的另类方式

POSTGRESQL SQL 优化,不建立索引,不调整参数,不修改SQL的另类方式

时间:2023-06-22 12:01:22浏览次数:46  
标签:statistics POSTGRESQL create ages 查询 索引 SQL test analyze


POSTGRESQL  SQL 优化,不建立索引,不调整参数,不修改SQL的另类方式_统计分析

开头还是介绍一下群,如果感兴趣polardb ,mongodb ,mysql ,postgresql ,redis 等有问题,有需求都可以加群群内有各大数据库行业大咖,CTO,软件架构师,软件开发大佬,可以解决你的问题。

在MYSQL 中很少听说过自建统计信息,实际上在其他数据库中,创建统计信息的方式和需求都是有的,尤其处理复杂SQL的数据库产品, POSTGRESQL 是可以对统计信息进行有方式的设计和自建的,支持的版本必须从 11 开始,所有想要有这个功能,你的最低版本是 POSTGRESQL 11.

POSTGRESQL  SQL 优化,不建立索引,不调整参数,不修改SQL的另类方式_postgresql_02

那么首先我们的提出为什么我们需要一个扩展统计信息的方式来进行相关的工作,需求在哪里。一般情况下的查询是不需要这样的扩展,而有一些大表,特殊的查询的确有一个更有效的数据收集对于数据查询是更有利的。

实际上在我们的认知里面,一般对语句的优化都是要建立对应的索引的,而我们大多忘记了另一个问题就是查询中一些查询因为统计信息与查询的数据的方式不匹配,导致即使有索引也对于查询是无效的。

我们用下面的例子来简单说明一下

我们建立一个表,并且灌入数据,这些数据库是时序性的数据,同时

create table test_t (time_d timestamp,value_d numeric DEFAULT random());

insert into test_t (time_d) SELECT * FROM generate_series('2022-01-01', '2023-06-30', '5 second'::interval);

create statistics test_t_day on (date_trunc('day',time_d)) from test_t;

analyze test_t;

explain analyze SELECT  date_trunc('day', time_d) as days, count(*) FROM  test_t  GROUP BY 1;

drop statistics  test_t_day;

explain analyze SELECT  date_trunc('day', time_d) as days, count(*) FROM  test_t  GROUP BY 1;

POSTGRESQL  SQL 优化,不建立索引,不调整参数,不修改SQL的另类方式_统计分析_03

从上面的截图可以看出在使用了 create statistics 后,查询的执行计划和没有建立 create statistics 的执行计划是截然不同的。使用了 create statistics 后整体的执行的计划变为了并行的方式并且gather merge 中的聚合的行数变为了 1090行,而不使用特殊的统计分析,则执行计划消耗的内存和ROW 都和全表扫描是一致的。在没有任何索引的情况下,执行计划在有效的统计信息的情况下,时间缩减了一半。

但在有些情况下,这样的方式也有一些问题,比如在这张表中增加一个主键,我们在看整体的效果是否有变化。在有主键的情况下,也是可以达到与上面没有主键一样的效果的。

POSTGRESQL  SQL 优化,不建立索引,不调整参数,不修改SQL的另类方式_数据库_04

除此以外,数据表中的条件之间有关联的情况下,也可以在统计分析中入手,进行一些统计分析中的特殊的操作。

create  table  test_t  (id serial primary key, age int, ages int);

insert into test_t (age,ages) SELECT i/100, i/500 FROM generate_series(1,2000000) s(i);

create statistics test_t_s (dependencies) on age,ages from test_t;

analyze test_t;

explain analyze select * from test_t where age = 1 and ages = 0 limit 1;

drop statistics test_t_s ;

explain analyze select * from test_t where age = 1 and ages = 0 limit 1;

POSTGRESQL  SQL 优化,不建立索引,不调整参数,不修改SQL的另类方式_postgresql_05

在这个例子中,查询的提速更加明显,提升了300多倍的速度。

这里例子中就是利用了联合统计方式,将查询中有关的两个字段,进行了联合的统计分析,在联合的统计分析中,可以获取到两个字段之间的关系,在这个数据集合里面,数据是有规律的,我们可以用一个SQL来分析出这样的规律。

每一种数值都是100个,而如果不使用create statistics 那么统计分析将不会关心这两个字段的关系,因为两个值之间是有对应关系的,如果不使用这样的方式,则是每个字段自己来进行统计分析,在查询中,这样的统计分析无法给查询带来任何的收益。

这里重要的问题在于当进行聚合的过程中,一般会产生两种结果
1  hash 聚合
2  group 聚合

如果你的work_mem 足够大的情况下,可以使用HASH 聚合,但是如果work_mem 不足够的情况下,则就需要将所有的行进行group 聚合,那么这样的情况下就会设计到使用磁盘来弥补内存的不足。

比如我们在举一个例子,这个表中的数据,需要经常分组,进行distinct 类似的统计的语句执行。


POSTGRESQL  SQL 优化,不建立索引,不调整参数,不修改SQL的另类方式_统计分析_06

drop statistics test_t_s;

create statistics test_t_s (ndistinct) on age,ages from test_t;
analyze test_t;

explain analyze select age,ages from test_t group by age,ages;

以下就是一个例子,大家可以很清晰的看到,如果不使用统计信息,则查询需要的时间是有特定统计信息的2倍。

POSTGRESQL  SQL 优化,不建立索引,不调整参数,不修改SQL的另类方式_sql_07

最后简单的介绍一下,create statistics 的集中类型

1  ndistinct ,这个类型主要是对应于分组多个列的分组,在类似这样的查询的方式中,会使用的比较顺手。

2  dependencies,  这个类型主要应用在查询中两个条件以上,并且这两个条件之间的值是有关联性的,或者逻辑课寻迹性。

3  自定义的方式,这与我们第一个列子中的使用方式一样,有类似函数 statistic 的意味

4  MVC ,这个部分需要弄清楚查询和多个值之间的关系,不建议轻易使用MVC的方式,这里就不在往下介绍。

实际上我们可以经常考虑的是 dependencies ,以及ndistinct 两种方式。

最后在阐述一下,在SQL的优化中是一个复合型的工作,并不是简单的使用索引,或者修改SQL,实际上我听到的最好的SQL的优化方式是,将这个业务逻辑推到。

POSTGRESQL  SQL 优化,不建立索引,不调整参数,不修改SQL的另类方式_sql_08

标签:statistics,POSTGRESQL,create,ages,查询,索引,SQL,test,analyze
From: https://blog.51cto.com/u_14150796/6534575

相关文章

  • MySQL
    初识MySQLJavaEE:企业级Java开发、Web前端(页面:展示——数据);后端(连接点:连接数据库JDBC,连接前端——控制视图跳转和给前端传递数据);数据库(存数据,Txt,Excel,world)。程序员等级:只会写代码,没学好数据库,基本混饭吃。操作系统,数据结构预算法!当一个不错的程序员!离散数学、数字电路......
  • NoSQL介绍
    NoSQL(NotNolySQL)不仅仅是SQL,泛指非关系型数据库,NoSQL数据库并不是要取代关系型数据库,而是关系型数据库的补充。 优点缺点关系型数据库MySQL、Oracle1、易于维护:都是使用表结构,格式一致;1、存储在硬盘上,所以读写性能比较差2、使用方便:SQL语言通用;2、固定的表......
  • PostgresSQL 概述
    PostgreSQL简介PostgreSQL是世界上最先进的开源对象-关系型数据库管理系统(ORDBMS),简称Postgres。它最初基于加利福尼亚大学伯克利分校开发的POSTGRES,Version4.2,至今已有30多年的历史。首先说开源,PostgreSQL是一个免费并且开源的软件。它的代码基于PostgreSQL许可发行,这是一......
  • 搜索引擎搜索技巧
    方法:  前言:以下用加号(+)表示空格,如A+B即A[空格]B;关键词+filetype:格式  指定文件类型搜索,较严格;平时也可以直接用“文件名+格式”搜索。    注意:只有搜索引擎支持的格式才可以使用filetype,如doc、ppt、pdf等;而epub、mobi等不行,它们可以使用“名称+格式......
  • MySQL 视图&存储过程&函数
    1视图1.1视图的作用当我们创建一张表的视图后,可以用和表差不多的使用方式来使用视图,比如可以对视图进行select查询操作、过滤或者排序数据等等。同时,也可以联结其它视图或者表,甚至可以添加和更新数据(但一般不会这么做,而且存在诸多限制)。总结起来,视图有以下优点:重用SQL语句,简......
  • LoadRunner通过SiteScope监控MySQL的性能
    步骤:安装SiteScope下载Java版的MySQL驱动,下载地址:http://www.mysql.com/downloads/connector/j/下载成功后,把解压缩的mysql-connector-java-5.1.14-bin.jar文件放入:C:\SiteScope\java\lib\ext 以及 C:\SiteScope\java64\lib\ext目录下。重启系统.进入SiteSc......
  • MariaDB 中常见的 SQL 错误
    常见的SQL错误有以下几种:表名错误:如果数据库中没有该表,或代码中将表名写错,都会导致程序找不到该表。列名错误:如果某张表中不存在该字段,或代码中将字段名写错,都会导致程序找不到该字段。groupby错误:可能是select语句中的字段没有在groupby子句中出现。权限错误:在公司里面我们要对......
  • MySQL约束
    1约束1.1约束分类NOTNULL:非空,用于保证该字段的值不能为空。比如姓名、学号等。DEFAULT:默认,用于保证该字段有默认值,比如性别。PRIMARYKEY:主键,用于保证该字段的值具有唯一性,并且非空。比如学号、员工编号等。UNIQUE:唯一,用于保证该字段的值具有唯一性,可以为空。比如座位号。......
  • mysql - #1067 - Invalid default value
    mysql中无法设置默认值为函数或者表达式,如果你强制设置时,就会报错误:#1067-Invaliddefaultvalue。这不是mysql的bug,而是故意这么设计的。参看:http://dev.mysql.com/doc/refman/5.0/en/data-type-defaults.html这里写道:"TheDEFAULTvalueclauseinadatatypespecification......
  • SQL Server 数据格式修改时,没有保存按钮的情况解决
    如果你使用的是SQLServer2008,当你修改数据结构后,保存时会报下图情况:Savingchangesisnotpermitted.Thechangesyouhavemaderequirethefollowingtablestobedroppedandre-created.Youhaveeithermadechangestoatablethatcan'tbere-createdorenabled......