首页 > 数据库 >MySQL存储引擎-存储结构

MySQL存储引擎-存储结构

时间:2024-12-18 19:28:24浏览次数:6  
标签:存储 缓冲区 innodb 引擎 InnoDB MySQL 空间 磁盘 page

Innodb存储结构

在这里插入图片描述

  1. Buffer Pool(缓冲池):BP以Page页为单位,页默认大小16K,BP的底层采用链表数据结构管理Page。在InnoDB访问表记录和索引时会在Page页中缓存,以后使用可以减少磁盘IO操作,提升效率。
    ○ Page根据状态可以分为三种类型:
    ■ free page : 空闲page,未被使用。
    ■ clean page:被使用page,数据没有被修改过。
    ■ dirty page:脏页,被使用page,数据被修改过。
    ○ 针对上述三种page类型,InnoDB通过三种链表结构来维护和管理
    ■ free list :表示空闲缓冲区,管理free page
    ■ flush list:表示需要刷新到磁盘的缓冲区,管理dirty page,内部page按修改时间排序。脏页即存在于flush链表,也在LRU链表中,但是两种互不影响,LRU链表负责管理page的可用性和释放,而flush链表负责管理脏页的刷盘操作。
    ■ lru list:表示正在使用的缓冲区,管理clean page和dirty page,缓冲区以midpoint为基点,前面链表称为new列表区,存放经常访问的数据,占63%;后面的链表称为old列表区,存放使用较少数据,占37%。
    ○ 改进型LRU算法维护
    ■ 普通LRU:末尾淘汰法,新数据从链表头部加入,释放空间时从末尾淘汰
    ■ 改性LRU:链表分为new和old两个部分,加入元素时并不是从表头插入,而是从中间midpoint位置插入,如果数据很快被访问,那么page就会向new列表头部移动,如果数据没有被访问,会逐步向old尾部移动,等待淘汰。每当有新的page数据读取到buffer pool时,InnoDb引擎会判断是否有空闲页,是否足够,如果有就将free page从free list列表删除,放入到LRU列表中。没有空闲页,就会根据LRU算法淘汰LRU链表默认的页,将内存空间释放分配给新的页。(解决预度失效和Buffer Pool污染问题)
    Buffffer Pool配置参数 (8.0版本)
    show variables like ‘%innodb_page_size%’; //查看page页大小
    page_size 16384B/1024=16KB
    show variables like ‘%innodb_old%’; //查看lru list中old列表参数
    old

    1. innodb_old_blocks_pct:这个变量表示InnoDB缓冲池中被认为是“旧”的块的百分比。 InnoDB使用这个百分比来决定哪些块应该被认为是“旧”的,这些块可能适合被替换出缓冲池。默认值是37%,意味着如果一个块在缓冲池中存在的时间超过所有块的37%,它就被认为是旧的。这个值可以通过调整来优化缓冲池中数据的替换策略,以适应不同的工作负载。
    2. innodb_old_blocks_time:这个变量定义了一个块在被标记为“旧”之前必须在缓冲池中停留的最小时间(以毫秒为单位)。默认值是1000毫秒(1秒)。如果一个块在缓冲池中停留的时间少于这个值,即使它的使用频率很低,它也不会被标记为旧块。这个设置可以帮助控制哪些页应该被优先替换出缓冲池。

    show variables like ‘%innodb_buffer%’; //查看buffffer pool参数
    buffer

  2. Change Buffer(写缓冲区):在进行DML操作时,如果BP没有其相应的Page数据, 并不会立刻将磁盘页加载到缓冲池,而是在CB记录缓冲变更,等未来数据被读取时,再将数据合并恢复到BP中。 ChangeBuffffer占用BufferPool空间,默认占25%,最大允许占50%,可以根据读写业务量来进行调整。参数innodb_change_buffer_max_size; size
    当更新一条记录时,该记录在BufferPool存在,直接在BufferPool修改,一次内存操作。如果该记录在BufferPool不存在(没有命中),会直接在ChangeBuffer进行一次内存操作,不用再去磁盘查询数据,避免一次磁盘IO。当下次查询记录时,会先进性磁盘读取,然后再从 ChangeBuffer中读取信息合并,最终载入BufferPool中。
    写缓冲区,仅适用于非唯一普通索引页,为什么?
    如果在索引设置唯一性,在进行修改时,InnoDB必须要做唯一性校验,因此必须查询磁盘,做一次IO操作。会直接将记录查询到BufferPool中,然后在缓冲池修改,不会在ChangeBuffer操作。

  3. Adaptive Hash Index:自适应哈希索引,用于优化对BP数据的查询。InnoDB存储引擎会监控对表索引的查找,如果观察到建立哈希索引可以带来速度的提升,则建立哈希索引,所以称之为自适应。InnoDB存储引擎会自动根据访问的频率和模式来为某些页建立哈希索引。

  4. Log Buffer:日志缓冲区,用来保存要写入磁盘上log文件的数据,日志缓冲区的内容定期刷新到磁盘log文件中。日志缓冲区满时会自动将其刷新到磁盘,当遇到BLOB 或多行更新的大事务操作时,增加日志缓冲区可以节省磁盘I/O。 LogBuffer主要是用于记录InnoDB引擎日志,在DML操作时会产生Redo和Undo日志。 LogBuffer空间满了,会自动写入磁盘。可以通过将innodb_log_buffer_size参数调大,减少磁盘IO频率 。

InnoDB磁盘主要包含Tablespaces,InnoDB Data Dictionary,Doublewrite Buffffer、Redo Log
和Undo Logs。

  1. 表空间(Tablespaces):用于存储表结构和数据。表空间又分为系统表空间、独立表空间、 通用表空间、临时表空间、Undo表空间等多种类型;
    ○ 系统表空间(The System Tablespace)
    包含InnoDB数据字典,Doublewrite Buffer,Change Buffer,Undo Logs的存储区
    域。系统表空间也默认包含任何用户在系统表空间创建的表数据和索引数据。系统表空
    间是一个共享的表空间因为它是被多个表共享的。该空间的数据文件通过参数
    innodb_data_file_path控制。
    系统表空间
    ○ 独立表空间(File-Per-Table Tablespaces)
    默认开启,独立表空间是一个单表表空间,该表创建于自己的数据文件中,而非创建于
    系统表空间中。当innodb_file_per_table选项开启时,表将被创建于表空间中。否则,
    innodb将被创建于系统表空间中。每个表文件表空间由一个.ibd数据文件代表,该文件
    默认被创建于数据库目录中。表空间的表文件支持动态(dynamic)和压缩
    (commpressed)行格式。
    ○ 通用表空间(General Tablespaces)
    通用表空间为通过create tablespace语法创建的共享表空间。通用表空间可以创建于
    mysql数据目录外的其他表空间,其可以容纳多张表,且其支持所有的行格式。
    ○ 撤销表空间(Undo Tablespaces)
    撤销表空间由一个或多个包含Undo日志文件组成。在MySQL 5.7版本之前Undo占用的
    是System Tablespace共享区,从5.7开始将Undo从System Tablespace分离了出来。
    InnoDB使用的undo表空间由innodb_undo_tablespaces配置选项控制,默认为0。参
    数值为0表示使用系统表空间ibdata1;大于0表示使用undo表空间undo_001、
    undo_002等。
    ○ 临时表空间(Temporary Tablespaces)
    临时表空间分为session temporary tablespaces 和global temporary tablespace两种。session
    temporary tablespaces 存储的是用户创建的临时表和磁盘内部的临时表。global
    temporary tablespace储存用户临时表的回滚段(rollback segments )。mysql服务
    器正常关闭或异常终止时,临时表空间将被移除,每次启动时会被重新创建。
  2. 数据字典(InnoDB Data Dictionary)
    InnoDB数据字典由内部系统表组成,这些表包含用于查找表、索引和表字段等对象的元数
    据。元数据物理上位于InnoDB系统表空间中。由于历史原因,数据字典元数据在一定程度上
    与InnoDB表元数据文件(.frm文件)中存储的信息重叠。
  3. 双写缓冲区(Doublewrite Buffer)
    位于系统表空间,是一个存储区域。在BufferPool的page页刷新到磁盘真正的位置前,会先
    将数据存在Doublewrite 缓冲区。如果在page页写入过程中出现操作系统、存储子系统或
    mysqld进程崩溃,InnoDB可以在崩溃恢复期间从Doublewrite 缓冲区中找到页面的一个好
    备份。在大多数情况下,默认情况下启用双写缓冲区,要禁用Doublewrite 缓冲区,可以将
    innodb_doublewrite设置为0。

    使用Doublewrite 缓冲区时建议将innodb_flush_method设 置为O_DIRECT。
    在这里插入图片描述
    MySQL的innodb_flush_method这个参数控制着innodb数据文件及redo log的打开、 刷写模式。有三个值:fsync(默认),O_DSYNC,O_DIRECT。设置O_DIRECT表示数据文件写入操作会通知操作系。不要缓存数据,也不要用预读,直接从Innodb Buffer写到磁盘文件。 默认的fsync意思是先写入操作系统缓存,然后再调用fsync()函数去异步刷数据文件与redo log的缓存信息。
  4. 重做日志(Redo Log)
    重做日志是一种基于磁盘的数据结构,用于在崩溃恢复期间更正不完整事务写入的数据。
    MySQL以循环方式写入重做日志文件,记录InnoDB中所有对Buffer Pool修改的日志。当出
    现实例故障(像断电),导致数据未能更新到数据文件,则数据库重启时须redo,重新把数
    据更新到数据文件。读写事务在执行的过程中,都会不断的产生redo log。默认情况下,重
    做日志在磁盘上由两个名为ib_logfifile0和ib_logfifile1的文件物理表示。
  5. 撤销日志(Undo Logs)
    撤消日志是在事务开始之前保存的被修改数据的备份,用于例外情况时回滚事务。撤消日志
    属于逻辑日志,根据每行记录进行记录。撤消日志存在于系统表空间、撤消表空间和临时表
    空间中。

MySQL 8.0 版本 的存储引擎

在这里插入图片描述
● 将InnoDB表的数据字典,双写缓冲区和Undo都从共享表空间ibdata中彻底分离出来了,以前需要ibdata中数据字典与独立表空间ibd文件中数据字典一致才行,8.0版本就不需要了。
● temporary 临时表空间也可以配置多个物理文件,而且均为 InnoDB 存储引擎并能创建索引,这样加快了处理的速度。
● 用户可以像 Oracle 数据库那样设置一些表空间,每个表空间对应多个物理文件,每个表空间可以给多个表使用,但一个表只能存储在一个表空间中。

标签:存储,缓冲区,innodb,引擎,InnoDB,MySQL,空间,磁盘,page
From: https://blog.csdn.net/m0_45362454/article/details/144565001

相关文章

  • tauri2文件资源访问和存储常见问题解决
    上tauri2的github上搜一下,发现问题还是挺多的,如果你是从tauri1迁移过来的话,估计要走的坑更多,因为tauri2的配置很多已经和tauri1不一样了,如果你还是习惯用tauri1的配置思维来搞tauri2的话,肯定会让你很难受。附上tauri2常用的几个链接:官方javascript的api文档:window|Tauri ......
  • 基于Spring Boot + SSM(Spring + Spring MVC + MyBatis)+Vue+MySQL实现一个简单的用户管
    后端代码(SpringBoot+SSM部分)1.创建SpringBoot项目使用SpringInitializr(可以通过IDEA等IDE自带的创建SpringBoot项目功能,或者访问Spring官网的Initializr页面)创建一个基础的SpringBoot项目,添加相关依赖,比如Web(用于构建Web应用)、MyBatis、MyBatisSpringBootStarter、My......
  • 一文读懂MySQL创建索引技巧,让你的查询**嗖一下**就快起来
    一文读懂MySQL创建索引技巧,让你的查询嗖一下就快起来!......
  • 数据持久性是如何炼成的——对象存储容灾技术解析
    存储系统作为支撑人工智能发展的关键基础设施,不仅需要提供弹性、海量数据存储能力,还要保证数据的安全性和可靠性,以确保业务的核心数据资产得以持久存储,大模型时代对海量数据的安全可靠存储提出了更高的要求。对象存储具有优秀的成本效益,丰富和卓越的数据安全保障措施,是构建云上企......
  • MySQL Explain 分析SQL语句性能
     一、EXPLAIN简介使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈。(1)通过EXPLAIN,我们可以分析出以下结果:表的读取顺序数据读取操作的操作类型哪些索引可以使用哪些索引被实际使用表之间的引......
  • 信息时代的核心引擎与发展展望
    信息时代的核心引擎与发展展望计算机的发展历程犹如一部波澜壮阔的科技史诗,众多杰出人物在其中发挥了关键作用,他们的智慧与创造力推动着计算机技术不断革新,众多具有标志性的重要事件宛如璀璨星辰,照亮了计算机不断演进的道路。演变史查尔斯・巴贝奇,1792年出生于英国,是一位富......
  • Python城市管理执法软件系统(Pycharm Flask Django Vue mysql)
    文章目录项目介绍和开发技术介绍具体实现截图开发技术开发与测试:设计思路系统测试可行性分析核心代码部分展示文章目录/写作提纲参考源码/演示视频获取方式项目介绍和开发技术介绍pycharm毕业设计项目框架支持:flask/djangoPython版本:python3.7.7开发软件:PyCharm......
  • MySQL插入数据重复时,数据已经存在,则更新或者忽略,不存在,则插入数据
    实现MySQL插入数据重复时更新,数据不存在时插入,只使用一条SQL语句的需求,可以通过以下几种方法来实现:首页先创建一张表,开始测试--创建一张users表,并把name设置为唯一索引。CREATETABLE`users`(`id`intNOTNULLAUTO_INCREMENT,`name`varchar(50)COLLATEut......
  • 操作系统(13)虚拟存储器
    前言    操作系统中的虚拟存储器是一项关键技术,它为用户提供了一个远大于实际物理内存容量的逻辑内存空间。一、定义与原理    虚拟存储器是具有请求调入功能和置换功能,能从逻辑上对内存容量加以扩充的存储器系统。其逻辑容量由内存容量与外存容量之和决定......
  • MySQL中的视图(如果想知道MYSQL中有关视图的知识,那么只看这一篇就足够了!)
        前言:视图(View)是数据库中一种虚拟的表,它通过封装复杂的查询简化数据操作,帮助用户更方便地访问数据。视图不仅提升了查询效率,还增强了数据安全性和逻辑独立性。✨✨✨这里是秋刀鱼不做梦的BLOG✨✨✨想要了解更多内容可以访问我的主页秋刀鱼不做梦-CSDN博客在......