首页 > 数据库 >1.存储引擎:深入解析 MySQL 存储引擎与 InnoDB 文件结构

1.存储引擎:深入解析 MySQL 存储引擎与 InnoDB 文件结构

时间:2024-11-08 23:16:21浏览次数:3  
标签:文件 存储 引擎 InnoDB MySQL 数据

MySQL 提供了多种存储引擎,适用于不同的业务场景。每种引擎在文件结构上设计独特,以便优化性能和功能。本文将详细介绍 MySQL 中常用存储引擎的文件结构,尤其是 InnoDB 引擎的多种文件类型及其作用,以帮助更深入地理解和选择适合的存储引擎。


一、MySQL 存储引擎概述与常用存储引擎对比

MySQL 支持多种存储引擎,每种引擎在文件结构和特性上各具特色。以下是几种常用存储引擎及其文件结构简述:

  1. InnoDB:支持事务的默认存储引擎,使用多种文件类型保证数据的安全性与一致性。
  2. MyISAM:传统的 MySQL 存储引擎,不支持事务,文件结构简单,适合读多写少的场景。
  3. Memory:将数据存储在内存中,访问速度极快,不生成数据文件。
  4. Archive:仅支持插入和高压缩,适用于历史数据存储。

二、InnoDB 存储引擎的文件结构详解

InnoDB 是 MySQL 默认存储引擎,文件结构复杂而严谨,通过多种文件确保事务一致性和崩溃恢复能力。以下是 InnoDB 的主要文件类型及其作用:

1. 表空间文件(.ibd 文件)

.ibd 文件是 InnoDB 中每个表的独立表空间文件,保存表数据和索引。

  • 作用:存储表的数据和索引。启用独立表空间(innodb_file_per_table=ON)后,每个表的 .ibd 文件会独立存储在对应数据库的目录下。
  • 结构:文件包含数据页和索引页,采用 B+ 树结构,确保快速数据访问。
  • 优点:独立的 .ibd 文件便于表的迁移和管理。
2. 系统表空间文件(ibdata 文件)

ibdata 文件是 InnoDB 的系统表空间,存储全局元数据和部分系统信息。

  • 作用:系统表空间保存 InnoDB 的全局数据字典、双写缓冲和部分撤销日志。
  • 结构ibdata 文件包含多个内部数据页,MySQL 启动时加载这些元数据。
  • 注意:即使启用了独立表空间,ibdata 文件依旧用于存储系统元数据,不能随意删除。
3. 重做日志文件(ib_logfile

ib_logfile 是 InnoDB 的事务日志文件,用于记录已提交事务的更改。

  • 作用:记录事务的修改操作,确保崩溃恢复的持久性。
  • 结构与机制:采用预写日志(WAL)机制,事务在写入磁盘前先写入重做日志。
  • 崩溃恢复:在系统崩溃后,ib_logfile 文件用于恢复至一致状态。
4. 撤销日志文件(Undo Tablespace)

撤销日志文件记录事务的反向操作,用于事务回滚和多版本并发控制(MVCC)。

  • 作用:支持事务回滚和 MVCC,实现数据的多版本访问。
  • 存储位置:默认情况下,撤销日志写入系统表空间,但也可以配置为独立文件。
  • 高并发支持:撤销日志减少了并发读写冲突,提高了 InnoDB 的事务处理效率。
5. 二进制日志文件(Binlog)

二进制日志文件是 MySQL 的全局日志,记录所有数据修改操作,用于恢复和主从同步。

  • 作用:记录数据修改的 SQL 语句,支持故障恢复和主从复制。
  • 格式:支持三种格式:STATEMENT(SQL 语句级)、ROW(行级)和 MIXED(混合模式)。
  • 持久化支持:对于 InnoDB,二进制日志是事务持久化的重要组成部分。

三、其他常用存储引擎的文件结构对比

InnoDB 虽然是 MySQL 默认引擎,但其他存储引擎在特定场景下也具备独特优势。以下是其他常用引擎的文件结构简析:

MyISAM 文件结构

MyISAM 是 MySQL 传统存储引擎,采用较为简单的文件结构。

  • 数据文件(.MYD:存储表的实际数据。
  • 索引文件(.MYI:存储表的索引。
  • 表定义文件(.frm:保存表的结构定义。

适用场景:MyISAM 不支持事务,但查询速度快,适合读多写少的场景,如统计分析和内容管理系统。

Memory 文件结构

Memory 存储引擎将数据存储在内存中,访问速度极快,但没有持久化支持。

  • 表定义文件(.frm:存储表的结构定义,数据本身存在内存中。

适用场景:适合用于缓存和会话数据等对速度要求高但数据安全性要求不高的场景。

Archive 文件结构

Archive 引擎支持高度压缩的数据存储,主要用于归档数据。

  • 数据文件(.ARZ:存储压缩的数据。
  • 表定义文件(.frm:保存表结构定义。

适用场景:适合用于日志归档、历史数据存储等需要大量写入但极少读取的场景。


四、MySQL 5.7 与 MySQL 8.0 在文件管理上的区别

MySQL 8.0 引入了 .sdi 文件来取代 .frm 文件的部分功能,文件管理更加标准化和兼容性更好。以下是 .frm.sdi 的区别:

文件类型缩写含义版本支持内容存储位置适用存储引擎
.frmFormMySQL 5.7 及之前表结构定义(字段、索引、约束等)数据库目录中MyISAM、InnoDB 等
.sdiSerialized Dictionary InformationMySQL 8.0 及之后JSON 格式的表结构定义包含在 .ibd 文件中所有存储引擎
.frm.sdi 的关键区别
  1. 格式差异.frm 文件采用专有格式,迁移时存在兼容性问题;.sdi 文件采用 JSON 格式,更具兼容性。
  2. 使用范围:MySQL 5.7 及之前版本使用 .frm 文件来存储表结构定义信息;MySQL 8.0 之后则使用 .sdi 文件。
  3. 管理位置.frm 文件独立存储在每个数据库目录中,而 .sdi 文件包含在表的 .ibd 文件中。

五、如何查看和修改表的存储引擎

MySQL 提供了查看和更改存储引擎的便捷命令:

查看表的存储引擎
SHOW TABLE STATUS LIKE 'table_name';
修改表的存储引擎
ALTER TABLE table_name ENGINE = InnoDB;
查看支持的存储引擎
SHOW ENGINES;

六、InnoDB 逻辑存储结构

InnoDB 的逻辑存储结构分为多个层级,采用分层设计来逐级管理和存储数据,从表空间到单个记录,层层递进,每一层级都承担不同的功能。具体分为以下层级:

  1. 表空间(Tablespace)
  2. 段(Segment)
  3. 区(Extent)
  4. 页(Page)
  5. 行(Row)

1. 表空间(Tablespace)

表空间是 InnoDB 逻辑存储结构的最高层,它是数据的存储区域,可以视为数据库存储的容器。InnoDB 支持以下几种表空间:

  • 系统表空间:包含全局数据字典、undo 日志等核心数据。在未启用独立表空间时,所有表的数据也存储在系统表空间。
  • 独立表空间:如果启用 innodb_file_per_table,每个表都会分配一个独立的表空间(.ibd 文件)。
  • 临时表空间:用于存储临时数据和表,通常用于排序和查询缓存。
  • 撤销表空间(Undo Tablespace):存储事务的撤销日志,为事务回滚和多版本并发控制(MVCC)提供支持。
2. 段(Segment)

段是表空间中的一个分组,负责存储特定类型的数据。InnoDB 将不同用途的数据分成独立的段管理,常见的段包括:

  • 数据段:存储表的数据记录。
  • 索引段:存储表的二级索引信息。
  • 回滚段:存储用于事务回滚的数据(撤销日志)。

设计优点:段的划分有助于管理不同类型的数据,便于提升数据的管理效率和优化性能。

3. 区(Extent)

区是由连续的页(通常是 64 个)组成的逻辑存储单元,每个区的大小为 1MB。区的作用是提升存储管理的效率,使得数据和索引能够更高效地利用磁盘空间。

  • 分配方式:InnoDB 会将表空间中的数据划分为多个区,每个区按需分配给段。
  • 优点:减少磁盘碎片,避免小页面带来的存储开销,提升数据访问的效率。
4. 页(Page)

页是 InnoDB 逻辑存储结构的最小单位,默认大小为 16KB(可以根据需求调整)。InnoDB 中的每个数据或索引项都存储在页中。

  • 页类型:

    • 数据页:存储实际数据行。
    • 索引页:存储二级索引。
    • Undo 页:存储撤销日志。
    • 系统页:存储 InnoDB 系统数据。
  • 页结构:页采用 B+ 树结构管理,以支持高效的查找、插入、删除等操作。

设计优点:页的大小和结构设计适合 InnoDB 的数据缓存管理和快速检索,有助于提高数据访问效率。

5. 行(Row)

行是数据存储的最小单元,每一行代表数据库表中的一条记录。InnoDB 引擎的行存储格式分为以下两种:

  • 紧凑格式(Compact):只存储实际数据,节省存储空间。
  • 冗余格式(Redundant):包含更多元数据,便于兼容旧版本的 MySQL。

多版本并发控制(MVCC):InnoDB 在行级别支持 MVCC,每行记录会存储额外的隐藏列(如事务 ID、回滚指针等),以便支持快照读取和事务隔离。

七、总结

不同存储引擎的文件结构设计,使得 MySQL 能够灵活应对多种业务需求。以下是选择存储引擎的常见依据:

  • 事务支持和数据一致性要求:选择 InnoDB。
  • 读多写少、查询性能要求高:选择 MyISAM。
  • 内存速度与数据持久性不敏感:选择 Memory。
  • 高效压缩存储、历史归档:选择 Archive。

理解 MySQL 不同存储引擎的文件结构和作用,将有助于优化数据库设计,提升系统的稳定性和性能。

标签:文件,存储,引擎,InnoDB,MySQL,数据
From: https://blog.csdn.net/m0_72560900/article/details/143610370

相关文章

  • 在Windows操作系统中,HKEY_CURRENT_USER\Console 是注册表中的一个键路径,它用于存储与
    在Windows操作系统中,HKEY_CURRENT_USER\Console是注册表中的一个键路径,它用于存储与控制台窗口(例如命令提示符窗口,CMD)的配置和设置相关的数据。以下是HKEY_CURRENT_USER\Console的详细说明:1. 位置路径:HKEY_CURRENT_USER\Console\2. 作用这个注册表项包含了当前用户对控制......
  • Oracle 存储过程分页 + Sqlsugar调用
    一、Oracle存储过程分页1createPROCEDUREGetPatientVisitData(2p_HospIdINVARCHAR2,--院区编码3p_strDateINVARCHAR2,--开始日期4p_endDateINVARCHAR2,--结束日期5p_page_sizeINNUMBER,--每页记录数6p_page_numberIN......
  • OSSFileBrowse:OSS存储桶遍历漏洞利用工具
    简介:由于经常遇到存储桶遍历漏洞,直接访问文件是下载,不方便预览,且甲方要求证明该存储桶的危害,因此该工具应运而生。使用javafx做图形化,kkFileView做文件预览接口。使用:命令行运行:java-Dfile.encoding=UTF-8-jarOSSFileBrowse-1.0-SNAPSHOT.jar或者直接点击run.bat文件。......
  • Linux磁盘存储
    磁盘存储设备文件设备文件是类Unix操作系统(包括Linux)中一种特殊的文件类型,它代表了设备接口,使得用户空间的程序可以通过标准的文件操作来访问和控制硬件设备。设备文件为周边设备提供了简单的接口,如打印机、硬盘等,也可以访问没有连接到任何真实设备的系统资源,如随机数生成......
  • 希冀 操作系统 实验四 段式存储管理
    申请进程apply()函数完成了新开进程的功能,同时还记录了该进程需要的内存空间段数和每段的具体大小,你需要补全该函数。补全的代码为:voidapply(){printf("请输入进程的名字:");scanf("%s",duanbiaos[duanbiaonum].processname);printf("请输入该进程的段数:");......
  • 智谱BigModel研习社|搭建 AI 搜索引擎 - 使用免费的Web-Search-Pro+脑图Agent智能体
    作者:Cartman文章:多智能体AI搜索引擎点击链接,更多实践案例等你探索~ #智谱BigModel研习社是专业的大模型开发者交流平台,欢迎在评论区与我们互动! 传统搜索引擎如今的问题在于输出很多不相关结果(大量垃圾信息+SEO操纵的标题党内容),大模型也面临着幻觉问题。在网......
  • C:\Windows\System32\spp\store 文件夹是 Windows 操作系统中与激活和许可证管理
    C:\Windows\System32\spp\store文件夹是Windows操作系统中与激活和许可证管理相关的一个重要文件夹。该文件夹存储了与Windows激活过程相关的信息、许可证密钥、许可证的状态等数据。具体来说,它主要涉及SoftwareProtectionPlatform(SPP),即软件保护平台。1. 什么是SPP......
  • 建模引擎的接口管理
    代码案例packagecom.xiangxin.fangwei;importcom.alibaba.fastjson.JSONObject;importorg.apache.http.client.entity.UrlEncodedFormEntity;importorg.apache.http.client.methods.CloseableHttpResponse;importorg.apache.http.client.methods.HttpPost;importor......
  • 双 11 如何实现高效营销,火山引擎 VeDI 助力实现消费者“量”“质”双提升
    自2009年至今,电商领域年度盛事的“双11”,已经历经了十五个年头,随着时间的推移,越来越多的平台和品牌商家,都加入到了这场狂欢当中。愈发垂直的品类、琳琅满目的商品、不断加码的促销玩法,让消费者们的可选择性越来越多。 那么,品牌商家应该如何在既有的“双11”玩法上推陈出新,......
  • Sqlsugar调用Oracle的存储过程
    前段时间在搬迁项目的时候,遇到一个问题,就是用sqlsugar调用oracle的存储过程的时候调用不了;当时卡了一整天,现在有空了把这个问题记录分享一下。先去nuget上安装一下sqlsugar的包:再安装一个oracle的驱动:添加一下Json包:再去创建一下连接 再创建一个测试用的存储过程crea......