首页 > 数据库 >MySQL高级10-InnoDB引擎存储架构

MySQL高级10-InnoDB引擎存储架构

时间:2023-09-19 19:34:42浏览次数:51  
标签:10 存储 文件 InnoDB MySQL 空间 磁盘

一、逻辑存储结构

  

  表空间(Tablespace):一个mysql实例,及一个数据库实例,可以对应多个表空间(ibd文件),用于存储记录,索引等数据。

  

  段(Segment):分为数据段(Leaf node segment)、索引段(Non-leaf node segment)、回滚段(Rollback segment),InnoDB是索引组织表,数据段就是B+树的叶子节点,索引段即为B+树的非叶子节点。段用来管理多个Extent(区)。

  区(Extent):表空间的单元结构,每个区的大小为1M, 默认情况下,InnoDB存储引擎页大小为16k,即一个区中一共有64个连续的页

  页(Page):页是InnoDB存储引擎磁盘管理的最小单元,每个页大小默认为16K,为了保证页的连续,InnoDB存储引擎每次从磁盘申请4-5个区

  行(Row):InnoDB存储引擎数据是按行进行存放的,Trx_id:每次对某条记录进行改动时,都会把对应的事务id赋值给这个trx_id隐藏列。Roll_pointer:每次对某条记录进行改动时,都会把旧的版本写入到undo日志中,然后这个隐藏列就相当于一个指针,通过它可以找到该记录修改前的信息

 

二、整体架构

  MySQL5.5 版本开始,默认使用 InnoDB 存储引擎,它擅长事务处理,具有崩溃恢复特性,在日常开发中使用非常广泛,下面是 InnoDB 架构图,左侧为内存架构,右侧为磁盘架构。 

  

 

三、内存结构

 

  内存架构中主要分为:Buffer Poll(内存缓冲池)、Change Buffer()、LogBuffer()、Adaptive Hash Index()四个区。

  3.1 Buffer Pool

    缓冲池是主内存中的一个区域,里面可以缓存磁盘上经常操作的真实数据,在执行增删改查操作时,先操作缓冲池中的数据,若缓冲池没有数据,则从磁盘加载并缓存,然后再以一定频率刷新到磁盘,从而减少磁盘IO,加快出来速度。缓冲池以Page页为单位,底层采用链表数据结构管理Page,根据状态可以将Page分为三种类型。

    • free page:空闲Page,未被使用。
    • clean page:被使用page,数据没有被修改过。
    • dirty page:脏页,被使用page,数据被修改过,其中数据与磁盘上的数据产生了不一致。

  3.2 Change Buffer

    更改缓冲区,针对与非唯一二级索引页,在执行DML语句时,如果这些数据Page没有在Buffer Pool中,不会直接操作磁盘,而是将数据变更存在更改缓冲区Change Buffer中,在未来数据被读取时,再将数据合并恢复到Buffer Pool中,再讲合并后的数据刷新到磁盘中。

    Change Buffer的意义:与集聚索引不同,二级索引通常是非唯一的,并且以相对随机的顺序插入二级索引,同样,删除和更新都可能会影响索引树中不相邻的二级索引页,如果每一次都操作磁盘,会造成大量的磁盘IO,有了Change Buffer之后,我们可以在缓冲池中进行合并处理,减少磁盘IO

  

  3.3 Adaptive Hash index

    自适应hash索引,InnoDB默认是不支持hash索引的,默认支持的是B+树的索引。因为hash索引不支持范围查找,仅可以用来做值匹配查找。但是自适应hash索引,用于优化对Buffer Pool数据的查询。InnoDB存储引擎会监控对表上各项索引页的查询,如果观察到hash索引可以提升速度,则建立hash索引,称之为自适应hash索引。

    自适应哈希索引,无需人工干预,是系统根据情况自动完成。通过 innodb_adaptive_hash_index 参数可以配置自适应hash索引的开启和关闭。 

mysql> show variables like "%innodb_adaptive_hash_index%";
+----------------------------------+-------+
| Variable_name                    | Value |
+----------------------------------+-------+
| innodb_adaptive_hash_index       | ON    |
| innodb_adaptive_hash_index_parts | 8     |
+----------------------------------+-------+
2 rows in set (0.00 sec)

  3.4 Log Buffer

    日志缓冲区,用来保存要写入到磁盘中的log日志(redolog,undolog),默认大小为16M, 日志缓冲区的日志会定期刷新到磁盘中,如果需要更新、插入或者删除许多行的事务,增加日志缓冲区的大小可以节省磁盘i/o

    通过 innodb_log_buffer_size 参数可以查看缓冲区大小

    通过 innodb_flush_log_at_trx_commit 参数可以查看刷新到磁盘时机。这里有0,1,2三个值:

      • 0:每秒将日志写入并刷新到磁盘一次。
      • 1:日志在每次事务提交时写入并刷新到磁盘。
      • 2:日志在每次事务提交后写入,并每秒刷新到磁盘一次。
mysql> show variables like "innodb_log_buffer_size";
+------------------------+----------+
| Variable_name          | Value    |
+------------------------+----------+
| innodb_log_buffer_size | 16777216 |
+------------------------+----------+
1 row in set (0.00 sec)

mysql>   show variables like "%flush_log%";
+--------------------------------+-------+
| Variable_name                  | Value |
+--------------------------------+-------+
| innodb_flush_log_at_timeout    | 1     |
| innodb_flush_log_at_trx_commit | 1     |
+--------------------------------+-------+
2 rows in set (0.00 sec)

 

四、磁盘架构

  

  4.1 System Tablespace  

    在MySQL中,System Tablespace(系统表空间)是一个用于存储系统表和一些特殊表的默认表空间。系统表空间包含了以下几个重要的系统表:

    • mysql.user:存储了MySQL中的用户和权限信息。
    • mysql.db:存储了所有数据库的信息。
    • mysql.host:存储了允许连接到MySQL服务器的主机信息。
    • mysql.tables_priv:存储了表级别的权限信息。
    • mysql.columns_priv:存储了列级别的权限信息。

    系统表空间还包含其他系统表,用于存储MySQL服务器的配置和元数据信息。
    系统表空间默认存储在名为`ibdata1`的共享文件中。这个文件通常位于MySQL的数据目录下。

    

    要注意的是,在InnoDB存储引擎中,除了系统表空间(System Tablespace),还存在一个叫做表空间文件(Tablespaces)的概念。表空间文件用于存储用户创建的表和索引。每个InnoDB表都会有一个对应的表空间文件。
    需要注意的是,有时候系统表空间的大小会超过预期,导致空间不足或性能问题。在这种情况下,可以考虑调整系统表空间的大小或进行其他优化措施以解决问题。
    总结:系统表空间是MySQL中用于存储系统表和特殊表的默认表空间,包含了一些重要的系统表,通常存储在名为`ibdata1`的共享文件中。

  4.2 File-Per-Table Tablespace

    

    File-Per-Table Tablespace(每个表一个表空间)是MySQL中的一个存储配置选项,它允许每个InnoDB表使用单独的表空间文件来存储数据和索引。这与默认情况下的系统表空间不同。

    在默认情况下,所有的InnoDB表共享一个系统表空间,即存储在ibdata1文件中。而使用File-Per-Table Tablespace选项,每个InnoDB表都会有一个独立的表空间文件,位于数据目录下。

    File-Per-Table Tablespace的优点包括:

    • 管理:每个表有自己的表空间文件,方便管理和维护。可以更方便地备份、恢复或迁移单个表。
    • 性能:每个表具有独立的表空间文件,可以在磁盘上更好地分布和组织数据,提高性能和并发访问的能力。
    • 存储空间:使用File-Per-Table Tablespace可以更有效地使用存储空间。当有大量小表或经常进行删除和重建表时,每个表的表空间文件可以更好地管理空间,避免系统表空间的不断增长。

    File-Per-Table Tablespace的缺点和注意事项包括:

    • 管理复杂性:每个表都会有一个独立的表空间文件,这可能增加了管理的复杂性,包括备份和维护的管理操作。
    • 存储和文件系统:使用File-Per-Table Tablespace可能涉及更多的磁盘IO操作,并可能增加文件系统的碎片化问题。

    使用File-Per-Table Tablespace可以在创建表时进行配置或在现有表上进行更改。要在创建新表时启用File-Per-Table Tablespace,可以在创建表的DDL语句中加上ENGINE=InnoDB选项。要在已有表上启用File-Per-Table Tablespace,可以使用MySQL的ALTER TABLE语句并设置innodb_file_per_table参数为ON。

    总结:File-Per-Table Tablespace是MySQL InnoDB存储引擎的一个选项,允许每个表使用单独的表空间文件存储数据和索引。它提供了更灵活的管理、更好的性能和更高效的存储空间利用率

  4.3 General Tablespaces

    General Tablespaces(通用表空间)是MySQL 5.7版本引入的一个功能,在InnoDB存储引擎中提供了更灵活和更高级的表空间管理选项。 

    通用表空间允许将多个InnoDB表存储在一个或多个共享表空间文件中,而不是每个表都有自己的独立表空间文件(如File-Per-Table Tablespace中)。这些共享表空间文件可以在运行时动态添加或删除新的表。

    通用表空间的优点包括:

    • 简化管理:使用通用表空间可以更方便地管理和维护多个表。可以将相关的表组织在同一个共享表空间中,便于备份、恢复和迁移。
    • 空间效率:通用表空间可以更有效地使用存储空间。多个表可以共享一个表空间文件,避免了为每个表都创建单独的表空间文件的开销。
    • 高性能:由于多个表共享表空间文件,可以提高磁盘IO操作的效率。此外,共享表空间可以利用预读机制(预读相邻页)来提高查询性能。

     使用通用表空间时,可以在创建表时指定TABLESPACE子句来为表分配到指定的共享表空间,也可以使用ALTER TABLE语句将现有表移动到共享表空间中。

     创建通用表空间示例:

mysql> create tablespace my_test add datafile "my_test.ibd" engine=InnoDB;
Query OK, 0 rows affected (0.01 sec)

    

     创建使用通用表空间的表示例:

mysql> create table tablespace_test(id int) tablespace my_test;
Query OK, 0 rows affected (0.03 sec)

    说明1:此时MySQL就不会再给tablespace_test表创建单独的表空间了,而是使用通用表空间my_test.ibd空间

    将现有表移动到通用表空间语法示例:

ALTER TABLE table_name TABLESPACE tablespace_name;

    说明2:`table_name`是要移动的表的名称,`tablespace_name`是要移动到的表空间的名称。    

    删除通用表空间语法示例

ALTER TABLESPACE tablespace_name DROP DATAFILE '<path>/tablespace_file.ibd';

    说明3:`tablespace_name`是要删除的表空间的名称,`<path>/tablespace_file.ibd`是要删除的表空间文件的路径和文件名。

  4.4 undo Tablespace

    在MySQL中,"undo tablespace"(撤销表空间)是用于存储撤销日志数据的一种特殊类型的表空间。

    撤销日志是 MySQL 中的一项重要功能,用于回滚或撤销事务中所做的更改。当事务执行 UPDATE、DELETE 或 INSERT 操作时,撤销日志记录了被修改或删除的非聚集索引的旧值,以及 INSERT 操作插入的新记录。这些撤销日志记录存储在名为 "undo log" 的数据结构中。

    为了高效地管理和存储撤销日志数据,MySQL引入了 "undo tablespace" 的概念。撤销表空间是一个独立于数据表空间的区域,用于存储撤销日志数据。它可以包含一个或多个文件,这些文件具有固定大小(通常是小于等于1GB)和特定的命名约定,默认的是undo_001和undo_002

    

    撤销表空间的主要作用有以下几个方面:

    • 提供事务的回滚能力:如果一个事务需要回滚,MySQL可以使用撤销表空间中的撤销日志来还原事务执行前的数据状态。
    • 支持并发事务:撤销表空间使得多个事务可以同时进行,并提供了事务隔离级别的支持。
    • 回收空间:当事务完成时,撤销表空间中的撤销日志可以被清除,空间可以被重复使用。

     撤销表空间在MySQL的配置文件(my.cnf或my.ini)中通过innodb_undo_directoryinnodb_undo_tablespaces配置项进行设置。innodb_undo_directory定义了撤销表空间文件的存储目录,而innodb_undo_tablespaces指定了要使用的撤销表空间文件的数量。

    总结:撤销表空间是MySQL中用于存储撤销日志数据的表空间,支持事务的回滚、并发事务和空间回收。

  4.5 Temporary Tablespace

    在MySQL中,临时表空间(Temporary Tablespace)是用于存储临时表数据和临时结果集的一种特殊类型的表空间。临时表空间的作用是存储临时表的数据,这些临时表通常是在查询过程中创建的。这些临时表可能包括临时表名、中间结果集或者用于排序和聚合的临时数据。

    默认情况下,MySQL使用系统表空间(system tablespace)来存储临时表数据。但是,在高并发环境下,使用单个系统表空间可能会导致性能瓶颈。为了提高性能并优化系统资源的使用,MySQL引入了临时表空间的概念。通过为临时表数据分配独立的临时表空间,MySQL可以更好地管理和优化临时表的创建和使用。临时表空间可以在独立的表空间文件中存储临时表数据,这些文件可以位于不同的存储设备上,从而分散了IO负载。

    可以通过以下配置项来设置临时表空间:既可以写在MySQL配置文件中也可以在MySQL交互界面上使用set 指令设置

    -`tmp_table_size`:用于设置每个临时表的内存大小。如果临时表大小超过此值,则会将其存储到临时表空间中。

    -`max_heap_table_size`:用于设置只在内存中存储的临时表的最大大小。

    -`tmpdir`:用于设置临时表空间的目录。

    使用临时表空间可以提升查询性能,减少对系统表空间的负载,并提供更好的系统扩展性和可维护性。

    总结:临时表空间是MySQL中用于存储临时表数据和临时结果集的表空间。它可以提高查询性能,并分散IO负载,提供更好的系统资源利用和扩展性。

  4.6 Doublewrite Buffer Files

    在MySQL中,Doublewrite Buffer Files(双写缓冲区文件)是一种用于提高数据保护和恢复机制的技术。Doublewrite Buffer Files使用了一种双写技术,先将数据写入到双写缓冲区文件,然后再写入到实际的数据文件。这可以减少数据损坏和页级别的IO不一致性的风险。双写缓冲区文件的主要作用是用于在MySQL崩溃或意外断电的情况下,保护InnoDB存储引擎使用的数据页的完整性。     当InnoDB存储引擎进行写操作时,会先将数据写入到双写缓冲区文件,然后通过后台线程将数据写入到磁盘上的实际数据文件。这样,在发生崩溃或断电时,双写缓冲区中的数据可以用来恢复数据文件的一致性。双写缓冲区文件在重启MySQL时会自动应用并删除。     双写缓冲区文件的大小由配置参数`innodb_doublewrite_buffer_size` 控制,默认值为`1MB`。可以通过在MySQL配置文件中设置该参数来修改双写缓冲区文件的大小。     使用双写缓冲区文件的一个潜在问题是会增加写操作的IO负载,因为每个写操作都需要写入两次。为了减少双写带来的性能影响,可以考虑将双写缓冲区文件放置在快速的存储介质上,如SSD。     总结:Doublewrite Buffer Files是一种用于提高数据保护和恢复机制的技术,通过在写入实际数据文件之前将数据先写入到双写缓冲区文件,来减少数据损坏和页级别的IO不一致性的风险。双写缓冲区文件的大小由配置参数控制,需要在MySQL配置文件中进行配置。

    

  4.7 Redo Log

    在MySQL中,Redo Log(重做日志)是用于实现事务的持久性和恢复能力的关键组件之一。它记录了发生在数据库中的数据更改操作,以确保在系统崩溃或断电时,能够将未完成的事务重新应用到数据库中,以保持数据的一致性。

    Redo Log是循环写入的,意味着当日志文件写满后,会重新从开头开始覆盖之前的日志。所有的修改操作都会先写入到Redo Log,然后异步地刷新到磁盘上的数据文件。这样即使在写操作还未刷新到磁盘上的数据文件时发生崩溃,通过Redo Log的回放可以重新执行未完成的事务,确保数据的持久性。

    Redo Log是以逻辑方式记录的,而不是物理方式。它记录了事务引起的数据修改,而不是实际的数据变化。通过记录这些逻辑操作,MySQL可以在恢复时重新执行所需的操作。

    在MySQL中,Redo Log由两个文件组成,通常为`ib_logfile0`和`ib_logfile1`。这些文件的大小由配置参数`innodb_log_file_size`控制,默认情况下为`48MB`。可以在MySQL配置文件中进行修改。

    使用Redo Log的一个重要注意事项是,写入Redo Log会引起磁盘IO操作,因此对于事务密集型负载,合理调整Redo Log的大小和I/O性能是很重要的。过小的Redo Log可能导致频繁的刷新和IO延迟,而过大的Redo Log可能对内存和磁盘空间带来负担。

    总结:Redo Log是MySQL中用于实现事务的持久性和恢复的关键组件,它记录了数据的修改操作,保证在系统崩溃或断电后,能够重新应用未完成的事务。Redo Log由两个文件组成,通过循环写入的方式记录数据修改。合理调整Redo Log的大小和I/O性能对于数据库性能和持久性是重要的。

    

 

 

标签:10,存储,文件,InnoDB,MySQL,空间,磁盘
From: https://www.cnblogs.com/Se7eN-HOU/p/17698144.html

相关文章

  • mysql逗号分隔的字符串转换为行
      SELECTa.id,substring_index(substring_index(a.code,',',b.help_topic_id+1),',',-1)age,a.yearFROMtaJOINmysql.help_topicbONb.help_topic_id<(length(a.code)-length(REPLACE(a.code,',','......
  • Navicat 修改mysql数据库时区【转】
    --查询当前系统时间SELECTnow();--检查MySQL系统时区showvariableslike'%time_zone%';--设置时区setglobaltime_zone='+08:00';--修改mysql全局时区为北京时间,即我们所在的东8区settime_zone='+08:00';--修改当前会话时区flushprivileges;--命令执......
  • Mysql数据库的索引
    1.索引的概念索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址(类似于c语言的链表通过指针指向数据记录的内存地址)。使用索引后可以不用扫描全表来定位某行的数据,而是先通过索引表找到该行数据对应的物理地址然后访问相应的数据,因此能加......
  • 10-SequentialTaskset有顺序的测试任务集
    SequentialTaskSet有顺序的任务集顾名思义,集合内的task是由上到下按顺序执行的,例如:fromlocustimportSequentialTaskSet,task,FastHttpUserclassMySTS(SequentialTaskSet):@taskdefstep_01(self):print(1)@taskdefstep_02(self):......
  • Mysql数据库的用户管理
    1.用户管理的具体操作1.1新建用户1.2修改用户密码1.3删除用户1.4修改用户名1.5忘记root密码时怎么重置密码1.先修改mysql的配置文件,在/etc/my.cnf下 3.输入命令修改user表中root的密码4.再修改mysql配置文件,改回去,之后重启服务,这样就修改了root用户的密......
  • mysql count()函数
    count(expr)函数的参数expr可以是任意的表达式,该函数用于统计在符合搜索条件的记录总数;count(expr)函数执行效率从低到高排序为:count(非主键字段)<count(主键)<count(1)≈count(*);对于count(1)和count(*),效率相当,建议尽量使用count(*),因为MySQL优化器会选择最小......
  • 2.Mysql存储引擎+数据类型
    日常生活中文件格式有很多中,并且针对不同的文件格式会有对应不同存储方式和处理机制(txt,pdf,word,mp4...) 针对不同的数据应该有对应的不同的处理机制来存储 存储引擎就是不同的处理机制 **MySQL主要存储引擎** *Innodb  是MySQL5.5版本及之后默认的存储引擎......
  • mysql 获取时间段 所有日期
    点击查看代码selectdate_add('2020-01-2000:00:00',intervalrowDAY)datefrom(SELECT@row:=@row+1asrowFROM(select0unionallselect1unionallselect2unionallselect3unionallselect4unionallselect5unionallselect6unionall......
  • 分析开发板信息中为啥df -h显示sda11分区挂载只有2GB Size且使用100%,但fdisk -l sda11
    问题点当使用开发板中的存储设备分区,进而格式化挂载到某个目录上后,使用df&lsblk后发现分区挂载情况和实际的存储器分区信息有差异后,会感到很疑惑,下面介绍遇到的情况:情况1使用xml添加分区后发现对应分区格式化&挂载对应设置的系统目录上但分区sizeAvailablesize&Used之和不相......
  • win10 mysql
    windows10下安装配置mysql8.0(保姆级教程)news2023/9/1910:53:13 文章目录一、MySQL8.0的基本信息二、MySQL8.0的系统要求三、MySQL8.0的安装步骤3.1.下载MySQL8.03.2.运行MySQL安装文件3.3.选择安装类型3.4.配置MySQLServer3.5mysqlshell的使......