首页 > 其他分享 >14 | count(*)这么慢,我该怎么办?

14 | count(*)这么慢,我该怎么办?

时间:2023-07-02 12:22:51浏览次数:49  
标签:count 14 累加 引擎 InnoDB 我该 null id

一下内容出自《MySQL 实战 45 讲》

14 | count(*)这么慢,我该怎么办?

count(*) 的实现方式

不同的 MySQL 引擎中,count(*) 有不同的实现方式。

  • MyISAM 引擎把一个表的总行数存在了磁盘上,执行 count(*) 的时候会直接返回这个数,效率很高;
  • InnoDB 引擎就执行 count(*) 的时候,需要把数据一行一行地从引擎里面读出来,然后累积计数。

为什么 InnoDB 不和 MyISAM 一样,也把数字存起来

即使是在同一时刻的查询,因为 MVCC 的原因,InnoDB 表 “应该返回多少行” 也是不确定的。

InnoDB 在执行 count(*) 操作的优化。

InnoDB 是索引组织表,主键索引树到的叶子节点是数据,而普通索引树的叶子节点是主键值。所以,普通索引树比主键索引树小的多。对于 count(*) , MySQL 优化器会找到最小的那棵树来遍历保证逻辑正确的情况下,尽量减少扫描的数据量,是数据库系统设计的通用法则之一

show table status 命令

image

命令中返回的 Rows 能代替 count(*) 吗?

这个值是采样估算来的,并不准确,官方说误差可能达到 45%~50%。

如何快速获取到表的行数?

从上面的可以得出:

  • MyISAM 表虽然 count(*) 很快,但是不支持事务;
  • show table status 命令虽然返回很快,但是不准确;
  • InnoDB 表直接 count(*) 会遍历全表,虽然结果准确,但会导致性能问题。

如果现在有一个页面经常要显示交易系统的操作记录总数,到底应该怎么办呢?答案是,只能自己计数。

  • 用缓存系统计数
    • 问题:丢失更新(崩溃丢失)、值逻辑上不正确,因为插入数据库和修改内存值并不是原子性的(分布式一致性问题)
  • 数据库保存计数
    • 可以解决崩溃丢失,InnoDB 是支持崩溃恢复不丢数据的。
    • 利用事务,可以保证值逻辑上的一致性。

总结:

​ 不同的存储构成的系统,不支持分布式事务,无法拿到精确一致的视图

​ 把计数值也放在 MySQL 中,就解决了一致性视图的问题。

不同 count 用法

先说结论:按照效率排序的话,count(字段)<count(主键 id)<count(1)≈count(*)

分析性能差别的原则:

1、server 层要什么就给什么;

2、InnoDB 只给必要的值;

3、现在的优化器只优化了 count(*) 的语义为“取行数”,其他“显而易见”的优化并没有做。

count(主键 id)

InnoDB 引擎会遍历整张表,把每一行的 id 值都取出来,返回给 server 层。server 层拿到 id 后,判断是不可能为空的,就按行累加。

count(1)

InnoDB 引擎遍历整张表,但不取值。server 层对于返回的每一行,放一个数字“1”进去,判断是不可能为空的,按行累加。

单看这两个用法的差别的话,能对比出来,count(1) 执行得要比 count(主键 id) 快。因为从引擎返回 id 会涉及到解析数据行,以及拷贝字段值的操作。

count(字段)

1、如果这个“字段”是定义为 not null 的话,一行行地从记录里面读出这个字段,判断不能为 null,按行累加;

2、如果这个“字段”定义允许为 null,那么执行的时候,判断到有可能是 null,还要把值取出来再判断一下,不是 null 才累加。

count(*)

专门做了优化,不取值。count(*) 肯定不是 null,按行累加。

标签:count,14,累加,引擎,InnoDB,我该,null,id
From: https://www.cnblogs.com/sun-yanglu/p/17520638.html

相关文章

  • React - 14 Hooks组件之useRef
    1.获取元素的3种方式方式1:ref={x=>refName=x}函数组件中没有this,直接给了一个变量。(可以用但是不推荐)方式2React.createRef()方式3useRef(null)2.函数组件用useRef,类组件用React.createRefimportReact,{useState,useEffect,useRef}from"react";import{Butto......
  • 149. 直线上最多的点数
    难度困难498给你一个数组 points ,其中 points[i]=[xi,yi] 表示 X-Y 平面上的一个点。求最多有多少个点在同一条直线上。 示例1:输入:points=[[1,1],[2,2],[3,3]]输出:3示例2:输入:points=[[1,1],[3,2],[5,3],[4,1],[2,3],[1,4]]输出:4 classSo......
  • LeetCode-146-LRU缓存
    146题:LRU缓存题目请你设计并实现一个满足 LRU(最近最少使用)缓存约束的数据结构。实现LRUCache类:LRUCache(intcapacity)以正整数作为容量 capacity初始化LRU缓存intget(intkey)如果关键字key存在于缓存中,则返回关键字的值,否则返回-1。voidput(intke......
  • 如何每天工作14个小时,同时获得精神休息和变得有创造力?
    分享者MattMochary是CEO教练,辅导过很多顶级公司的创始人,如OpenAI,Notion,Reddit,Coinbase,Robinhood,YC等。​他辅导的大多数CEO都是每天工作14小时,如果他们有配偶和孩子,会再花几个小时与他们联系。其余的时间,他们都在睡觉,但永远也睡不够。 这种生活方式的代价是,没有留......
  • 算法学习day04链表part02-24、19、0207、142
    packageSecondBrush.LinkedList.LL1;/***24.两两交换链表中的节点**/publicclassSwapNodesInPairs_24{publicListNodeswapPairs(ListNodehead){ListNodedummyhead=newListNode(-1);dummyhead.next=head;ListNodecur......
  • Windows兼容模式怎么设置?140.210.18.x
    服务器兼容是什么意思?服务器兼容性怎么改?兼容性(compatibility)是指硬件之间、软件之间或是软硬件组合系统之间的相互协调工作的程度。兼容的概念比较广,相对于硬件来说,几种不同的电脑部件,如CPU、主板、显示卡等,如果在工作时能够相互配合、稳定地工作,就说它们之间的兼容性比较好,反之就......
  • postgresql 14安装步骤(linux)
     ps:(跟别人视频看的,有坑,记得全看完)打开官网https://www.postgresql.org/download/linux/redhat/选择需要数据库的版本,虚拟机系统根据官方文档的步骤安装即可(我用的是postgresql14+centos7,主要是学习测试使用)  按照步骤安装:(yum)1.配置yum源sudoyuminstall-y......
  • LeetCode 142. 环形链表 II
    /***Definitionforsingly-linkedlist.*structListNode{*intval;*ListNode*next;*ListNode(intx):val(x),next(NULL){}*};*/classSolution{public:ListNode*detectCycle(ListNode*head){if(!head)return......
  • Arrangement排列•Combination组合•Counting计数•Binomial Theorem二项式定理
    符号C-Combination组合数[1]A-Arrangement(旧教材为P-Permutation)N-Number元素的总个数(自然数集合).M-参与选择的元素个数(M不大于N,两者都是自然数集合).!-Factorial阶乘.Arrangement排列与Combination组合:注意:n,m都是自然数,且m<=n,下同.排列的定义:从n......
  • 光脚丫学LINQ(014):LINQ to SQL简介
    视频演示:http://u.115.com/file/f29f7838f6 LINQtoSQL是.NETFramework3.5版的一个组件,提供了用于将关系数据作为对象管理的运行时基础结构。说明关系数据显示为由二维表(关系或平面文件)组成的集合,其中公共列将表互相关联起来。若要有效地使用LINQtoSQL,您必须略为熟悉关......