首页 > 其他分享 >6、索引的数据结构树

6、索引的数据结构树

时间:2023-09-14 11:01:41浏览次数:59  
标签:存储 Tree 叶子 索引 磁盘 数据结构 节点

数据库索引B+树查找过程:

5.2 B+Tree
B+Tree 是在 B-Tree 基础上的一种优化,InnoDB 存储引擎就是用 B+Tree 实现其索引结构。它带来的变化点:

B+树每个节点可以包含更多的节点,这样做有两个原因,一个是降低树的高度。另外一个是将数据范围变为多个区间,区间越多,数据检索越快
非叶子节点存储key,叶子节点存储key和数据
叶子节点两两指针相互链接(符合磁盘的预读特性),顺序查询性能更高
注:MySQL 的 InnoDB 存储引擎在设计时是将根节点常驻内存的,因此力求达到树的深度不超过 3,也就是说 I/O 不需要超过 3 次。
————————————————
原文链接:https://blog.csdn.net/yy339452689/article/details/103816128

那么b树的核心是几个关键词

  1. 树高:一般来说,树的高度要比二叉平衡树低很多(每个节点可以包含更多的节点)

  2. 数组:每一个node,都是一个“数组”,数组是很关键的决定性因素,我们后面写入和读取分析的时候会讲到。

B+ 树单值查询
假设我们要查的值为32.
第一次磁盘 I/O,查找磁盘块1,即根节点(36,43),因为32小于36,因此访问根节点的左边第一个孩子节点

img

第二次磁盘 I/O, 查找磁盘块2,即根节点的第一个孩子节点,获得区间(28,32),遍历即可得32.

img

B+Tree相对于B-Tree有几点不同:

  1. 非叶子节点只存储键值信息。
  2. 所有叶子节点之间都有一个链指针。
  3. 数据记录都存放在叶子节点中。

B+树经典面试题

  • InnoDB一棵B+树可以存放多少行数据?

    答:约2000万条(InnoDB一页16kb,根节点只存储主键【主键long类型8b(字节),页地址指针6b】。则:

    根节点可以存储(16*1024/14)条数据(约等于1170条)

    假设叶子节点一条数据1kb,而一页是16kb那么一页可以存储16条数据、

    两级b+树约可以存储:1170*16

    三级b+树约可以存储:1170* 1170 * 16

  • 为什么索引结构默认使用B+树,而不是hash,二叉树,红黑树,B-树?

  • B-树和B+树的区别

答案:

为什么索引结构默认使用B+树,而不是B-Tree,Hash哈希,二叉树,红黑树?
简单版回答如下:

  • Hash哈希,只适合等值查询,不适合范围查询。
  • 一般二叉树,可能会特殊化为一个链表,相当于全表扫描。
  • 红黑树,是一种特化的平衡二叉树,MySQL 数据量很大的时候,索引的体积也会很大,内存放不下的而从磁盘读取,树的层次太高的话,读取磁盘的次数就多了。
  • B-Tree,叶子节点和非叶子节点都保存数据,相同的数据量,B+树更矮壮,也是就说,相同的数据量,B+树数据结构,查询磁盘的次数会更少。

B-树和B+树的区别

  • B-树内部节点是保存数据的;而B+树内部节点是不保存数据的,只作索引作用,它的叶子节点才保存数据。
  • B+树相邻的叶子节点之间是通过链表指针连起来的,B-树却不是。
  • 查找过程中,B-树在找到具体的数值以后就结束,而B+树则需要通过索引找到叶子结点中的数据才结束
  • B-树中任何一个关键字出现且只出现在一个结点中,而B+树可以出现多次。

详情:(MySQL索引底层:B+树详解 - 知乎 (zhihu.com)

标签:存储,Tree,叶子,索引,磁盘,数据结构,节点
From: https://www.cnblogs.com/kkbk/p/17701925.html

相关文章

  • 5、索引碎片
    一、碎片产生的原因碎片是由于表中的数据修改产生的。当插入、更新表中的数据时,表对应的聚簇索引被修改,如果对索引的修改不能容纳在同一页面中,可能导致索引叶子页面被分割。从而添加一个新的页面用以包含原来页面的一部分,并且维持索引键中行的逻辑顺序。虽然新的页面维......
  • 4、索引如何设置填充因子
    理解填充因子重建索引固然可以解决碎片的问题.但是重建索引的代价不仅仅是麻烦,还会造成阻塞。影响使用.而对于数据比较少的情况下,重建索引代价并不大。而当索引本身超过百兆的时候。重建索引的时间将会很让人蛋疼.填充因子的作用正是如此。对于默认值来说,填充因子为0(0和100表示......
  • 3、组合索引
    复合索引的优点和注意事项概念:单一索引是指索引列为一列的情况,即新建索引的语句只实施在一列上;用户可以在多个列上建立索引,这种索引叫做复合索引(组合索引);复合索引在数据库操作期间所需的开销更小,可以代替多个单一索引;同时有两个概念叫做窄索引和宽索引,窄索......
  • 2、关于索引的二次查询
    聚集索引VS非聚集索引(B+树)超级详细讲解【字节跳动大佬】(MySQL索引-B+树(看完你就明白了)-苍青浪-博客园(cnblogs.com))在上节介绍B+树索引的时候,我们提到了图中的索引其实是聚集索引的实现方式。那什么是聚集索引呢?在MySQL中,B+树索引按照存储方式的不同分为聚集索引和......
  • 1、查看索引命中情况
    --查看索引命中详情:setstatisticstimeonsetstatisticsioonsetstatisticsprofileonselect*from表名使用索引好处:执行原理(https://blog.csdn.net/m0_38128121/article/details/79663261)b+树:非叶子节点不存储真实的数据,只存储指引搜索方向的数据项b+树的查找过程......
  • 聚簇索引
    聚簇索引(ClusteredIndex)是数据库中一种特殊的索引类型,它决定了表中数据的物理存储顺序。在聚簇索引中,表中的数据按照索引的顺序进行物理排序,并且每个表只能有一个聚簇索引。举个例子,考虑一个名为"employees"的表,包含以下列:employee_id、first_name、last_name、salary。如果......
  • 开发环境篇之HALCON数据结构
    开发环境篇之HALCON基础目录基本数据分类图标类数据Image(图片)Pixel:像素Channel:通道Domain:域图片操作Region(区域)Region操作XLD(轮廓)XLD操作Control(控制类数据)数据监视数组Iconic数组(Objects)Control数组(Tuple)Vector数组字典扩展:坐标系和角度参考资料基本数据分类Iconic图......
  • MySQL入门系列11-索引
    一、概念索引是帮助MySQL高效获取数据的数据结构。数据库除了存储数据之外,还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用数据,当我们在查找数据的时候,就可以在这些数据结构上实现高级查找算法,快速查找我们需要的数据,这种数据结构就是索引。在没有索引的情况下,查询......
  • 洛谷[P1305 新二叉树] Tag:二叉树、基础数据结构
    P1305新二叉树题目描述:输入一串二叉树,输出其前序遍历。输入格式:第一行为二叉树的节点数$n(1\len\le26)$,后面\(n\)行,每一个字母为节点,后两个字母分别为其左右儿子。特别地,数据保证第一行读入的节点必为根节点。空节点用*表示输出格式:二叉树的前序遍历。思路:对......
  • 索引常见面试题
    索引常见面试题什么是索引?索引是数据的目录,用来加快数据的搜索,类似书本的目录可以分为几个类型数据结构b+树索引,通过b+树存储索引,但是非叶子节点保存数据,叶子节点保存数据hash索引:通过hash计算得出索引位置fulltext索引:也叫全文索引(我不会介绍)物理存储聚簇索引:索引......