首页 > 数据库 >谈谈MySQL的基数统计

谈谈MySQL的基数统计

时间:2022-12-15 13:33:29浏览次数:68  
标签:stats sex 索引 谈谈 innodb MySQL 基数

**

目录

  • ​​推荐阅读方式​​
  • ​​一、基数是啥?​​
  • ​​二、InnoDB更新基数的时机?​​
  • ​​三、基数是估算出来​​
  • ​​四、持久化基数​​
  • ​​四、如何主动更新基数?​​
  • ​​推荐阅读​​

Hi,大家好!我是白日梦。

今天我要跟你分享的话题是:“大家常说的基数是什么?”


一、基数是啥?

Cardinality指的就是MySQL表中某一列的不同值的数量。

如果这一类是唯一索引,那基数 = 行数。

如果这一列是sex,枚举类型只有男女,那它是基数就是2

Cardinality越高,列就越有成为索引的价值。MySQL执行计划也会基于Cardinality选择索引。

通过下面的方式可以看到表中各列的基数。

谈谈MySQL的基数统计_数据库

比如这个经典的例子:
有一列为sex,那对于sex列中存储的值来说 非男即女,它的基数最大就是2。
那也就完全没有必要为sex建立索引。因为,为了提升你基于sex的查询速度,MySQL会为你选择的这个新索引创建一棵全新的B+Tree。但你sex只有两种值,对于MySQL来说,即使它为你指定的列建立了B+Tree索引,真正执行查询时,最多进行一次二分查询,剩下的操作只能是遍历,所以为sex创建索引意义不大。

二、InnoDB更新基数的时机?

参数:​​innodb_stats_auto_recalc​​​控制MySQL是否主动重新计算这些持久性的信息。默认为1表示true,0表示false。
默认情况下当表中的行变化超过10%时,重新计算基数信息。

三、基数是估算出来

基数并不会实时更新!而且它是通过采样估算出来的值!

至于基数的公式是怎样的,可能并不重要。

重要的是你得知道,他是通过随机采样数据页的方式统计出来的一个估算值。

而且随机采样的页数可以通过参数​​innodb_stats_persistent_sample_pages​​ 设置,默认值是20。

这就意味着 基数值并不准确,甚至你每次计算的结果相擦还是蛮大的。

四、持久化基数

可以通过参数​​innodb_stats_persistent​​ 控制是否持久化基数,默认为off。

当然你可以为一个单独的表设置 ​​STATS_PERSISTENT=1​​​ 那么它的 ​​innodb_stats_persistent​​将自动被启用。

开启它的好处是:重启MySQL不会再重复计算这个值,加快重启速度。

四、如何主动更新基数?

执行下面的SQL时都会触发InnoDB更新基数(即使你并没有意识到它会更新基数)。

所以尽量选择一个业务低峰期

  • ​analyze table tableName;​

谈谈MySQL的基数统计_MySQL_02

如果因为采样的数量太少了,计算的基数错的离谱。那很可能会导致MySQL的优化器选错索引。这是你可以将这个值适当调大。但是增加 太多可能会导致 ​​ANALYZE TABLE​​运行缓慢。

反之, ​​ANALYZE TABLE​​​运行太慢。你可以适度调整参数​​innodb_stats_persistent_sample_pages​​ 的值。但是这又可能导致基数计算的不准确。

如果没有办法平衡两者的关系。可以考虑减少表中索引列的数量或限制分区的数量以降低 ANALYZE TABLE复杂性。表的主键中的列数也很重要,因为主键列被附加到每个非唯一索引中。

参考:

​https://dev.mysql.com/doc/refman/5.7/en/innodb-persistent-stats.html​

​https://dev.mysql.com/doc/refman/5.7/en/innodb-analyze-table-complexity.html​

谈谈MySQL的基数统计_MySQL_03


标签:stats,sex,索引,谈谈,innodb,MySQL,基数
From: https://blog.51cto.com/u_15311508/5939338

相关文章

  • 一看就懂的MySQL的FreeList机制
    Hi,大家好!我是白日梦!今天我要跟你分享的MySQL话题是:“了解InnoDB的FreeList吗?谈谈看!”本文是MySQL专题的第7篇,共110篇。一、回顾前面几篇文章白日梦和你分享了,我们从磁盘中......
  • Python爬虫爬取国家统计局2009年到2020年,统计用区划和城乡划分代码(省市区/县三级)并存
    国家统计局->统计标准网址:​​http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/​​流程对统计标准的网站进行分层分级爬取  代码importpymysqlfrombs4importBeaut......
  • 查看mysql当前事务锁并kill
    执行如下SQL,查看当前事务:selectt.trx_mysql_thread_id,t.trx_started,t.trx_state,t.trx_tables_in_use,t.trx_tables_locked,t.trx_rows_locked,t......
  • python2中mysql插入中文的问题
    insert_sql_template="""insertintoap_console_template(`id`,`name`,`type`,`content`,`desc`)values(%s,'%s',%s,'%s','%s')"""forrow_datain......
  • mysql存储过程 便利查询结果集 并 获取结果集数据 插入新表数据
    --建立存储过程之前需要判断该存储过程是否存在,若存在则删除DROPPROCEDUREIFEXISTSinsert_project_unit;--创建存储过程,insert_project_unit为存储过程名CREATE......
  • MYSQL安装
    MYSQL安装一.DBA工作内容及课程体系img二.MySQL课程体系介绍三.DBA的职业素养四.MySQL简介及安装01什么是数据?数据(data)是事实或观察的结果,是对客观事物的逻辑归......
  • 设置MySql事务隔离级别的坑
    结论设置MySql会话级别事务隔离级别时需要先设置当前会话的事务隔离级别,然后再开启事务,否则新开启的事务隔离级别不是新设置的,而是之前的。验证过程1.查看当前会话的隔......
  • MySQL的字符集配置
      utf8的锅:场景 :之前在给客户做微商城时,需要保存微信的授权信息,此时就有一个nickname字段,在设计数据表时,潜意识的将表的存储格式设置为utf8,生产上线一段时间后偶尔出现......
  • mysql参数配置文件
    (1)参数配置文件中的内容以键值对形式存在。(2)如何查看键值对?showvariableslike'%name%';或者查看information_schema库下的global_variables视图; 如何修改呢?  1、innod......
  • golang.mysql
    一、mysql操作基本语法1、创建名称nulige的数据库 ​​CREATEDATABASEnuligeDEFAULTCHARSETutf8COLLATEutf8_general_ci;<br><br>usenulige​​2、建表,Id自增​​c......