首页 > 数据库 >第二十一天:mysql--INDEX 索引

第二十一天:mysql--INDEX 索引

时间:2024-02-12 22:45:43浏览次数:31  
标签:INDEX name index -- 使用 查询 索引 mysql

一、INDEX 索引介绍

索引:是排序的快速查找的特殊数据结构,定义作为查找条件的字段上,又称为键key,索引通过存储引擎实现

优点:   索引可以降低服务需要扫描的数据量,减少了IO次数   索引可以帮助服务器避免排序和使用临时表   索引可以帮助将随机I/O转为顺序 I/O 缺点:   占用额外空间,影响插入速度 索引类型:   B+ TREE、HASH、R TREE、FULL TEXT   聚簇(集)索引、非聚簇索引:数据和索引是否存储在一起   主键索引、二级(辅助)索引   稠密索引、稀疏索引:是否索引了每一个数据项   简单索引、组合索引: 是否是多个字段的索引   左前缀索引:取前面的字符做索引   覆盖索引:从索引中即可取出要查询的数据,性能高 二、索引结构

参考链接 : https://www.cs.usfca.edu/~galles/visualization/Algorithms.html

二叉树 参考链接: https://www.cs.usfca.edu/~galles/visualization/BST.html

红黑树

参考链接:https://www.cs.usfca.edu/~galles/visualization/RedBlack.html B-Tree 索引 参考链接: https://www.cs.usfca.edu/~galles/visualization/BTree.html

 B+Tree索引

参考链接: https://www.cs.usfca.edu/~galles/visualization/BPlusTree.html B+Tree索引:按顺序存储,每一个叶子节点到根结点的距离是相同的;左前缀索引,适合查询范围类的数据 

 

可以使用B+Tree索引的查询类型:(假设前提: 姓,名,年龄三个字段建立了一个复合索引) 全值匹配:精确所有索引列,如:姓wang,名xiaochun,年龄30 匹配最左前缀:即只使用索引的第一列,如:姓wang 匹配列前缀:只匹配一列值开头部分,如:姓以w开头的记录 匹配范围值:如:姓ma和姓wang之间 精确匹配某一列并范围匹配另一列:如:姓wang,名以x开头的记录 只访问索引的查询 B+Tree索引的限制: 如不从最左列开始,则无法使用索引,如:查找名为xiaochun,或姓为g结尾 不能跳过索引中的列:如:查找姓wang,年龄30的,只能使用索引第一列 Hash索引 Hash索引:基于哈希表实现,只有精确匹配索引中的所有列的查询才有效,索引自身只存储索引列对应的哈希值和数据指针,索引结构紧凑,查询性能好 地理空间数据索引R-Tree( Geospatial indexing )    全文索引(FULLTEXT)    聚簇和非聚簇索引,主键和二级索引

 

冗余和重复索引:  

三、索引优化

独立地使用列:尽量避免其参与运算,独立的列指索引列不能是表达式的一部分,也不能是函数的参数,在where条件中,始终将索引列单独放在比较符号的一侧,尽量不要在列上进行运算(函数 操作和表达式操作) 左前缀索引:构建指定索引字段的左侧的字符数,要通过索引选择性(不重复的索引值和数据表的记录总数的比值)来评估,尽量使用短索引,如果可以,应该制定一个前缀长度 多列索引:AND操作时更适合使用多列索引,而非为每个列创建单独的索引 选择合适的索引列顺序:无排序和分组时,将选择性最高放左侧  只要列中含有NULL值,就最好不要在此列设置索引,复合索引如果有NULL值,此列在使用时也不会使用索引 对于经常在where子句使用的列,最好设置索引 对于有多个列where或者order by子句,应该建立复合索引 对于like语句,以 % 或者 _ 开头的不会使用索引,以 % 结尾会使用索引 尽量不要使用not in和<>操作,虽然可能使用索引,但性能不高 不要使用RLIKE正则表达式会导致索引失效 查询时,能不要*就不用*,尽量写全字段名,比如:select id,name,age from students; 大部分情况连接效率远大于子查询 在有大量记录的表分页时使用limit 对于经常使用的查询,可以开启查询缓存 多使用explain和profile分析查询语句 查看慢查询日志,找出执行时间长的sql语句优化 

 

四、管理索引

创建索引:
CREATE [UNIQUE] INDEX index_name ON tbl_name (index_col_name[(length)],...);
ALTER TABLE tbl_name ADD INDEX index_name(index_col_name[(length)]);
help CREATE INDEX;
删除索引:
DROP INDEX index_name ON tbl_name;
ALTER TABLE tbl_name DROP INDEX index_name(index_col_name);
查看索引:
SHOW INDEX FROM [db_name.]tbl_name;
优化表空间:
OPTIMIZE TABLE tb_name;
查看索引的使用 
SET GLOBAL userstat=1;  #MySQL无此变量
SHOW INDEX_STATISTICS;

 

五、EXPLAIN 工具

 可以通过EXPLAIN来分析索引的有效性,获取查询执行计划信息,用来查看查询优化器如何执行查询

参考资料: https://dev.mysql.com/doc/refman/5.7/en/explain-output.html 语法:
EXPLAIN SELECT clause
EXPLAIN输出信息说明: 

  type显示的是访问类型,是较为重要的一个指标,结果值从好到坏依次是:NULL> system >const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery >range > index > ALL ,一般来说,得保证查询至少达到range级别,最好能达到ref

 

六、使用 profile 工具 

#打开后,会显示语句执行详细的过程
set profiling = ON;
#查看语句,注意结果中的query_id值
show profiles ;
#显示语句的详细执行步骤和时长
Show profile for query #
#显示cpu使用情况
Show profile cpu for query #

 

标签:INDEX,name,index,--,使用,查询,索引,mysql
From: https://www.cnblogs.com/dujy/p/18014145

相关文章

  • 树莓派相关配置
    树莓派配置记录1、网络配置系统为ubuntu16.04,配置wifi连接固定wifi网络,以及配置静态IP方便ssh登录,配置步骤:sudovim/etc/network/interfaces添加以下内容:autowlan0allow-hotplugwlan0ifacewlan0inetstaticaddress192.168.x.xxnetmask255.255.255.0gateway......
  • 17.Jenkins的Git版本管理
    Git的集成 在Jenkins上构建从Git源码仓库拉取代码的任务时需要使用到Git插件在执行job的机器上安装好Git yuminstallgit-y下载Git插件 进入菜单Dashboard->系统管理(ManageJenkins)->插件管理(ManagePlugins)在可选插件搜索Git找到Git......
  • 3.OGG常用的命令
    1.查看历史命令GGSCI(19c_p)8>hGGSCICommandHistory1:infoall2:lagext_demo3:lagextractextract4:lagextractext_demo5:infoall6:viewparamsext_demo7:viewparamsmgr8:h   GGSCI(19c_p)8> !  ......
  • php调用sql server过程记录
    更新微软源,需要安装微软的底层库curlhttps://packages.microsoft.com/config/rhel/7/prod.repo>/etc/yum.repos.d/mssqlrelease.repo安装依赖底层库yuminstall-ymsodbcsqlmssql-toolsunixODBC-devel根据php版本选择对应的pdo_sqlsrv扩展版本,查询地址为http://pecl.ph......
  • Suffix Array:后缀数组学习笔记
    后缀排序后缀排序,顾名思义就是给后缀排个序。朴素做法是\(O(n^2\logn)\)的,无法接受。因此诞生了基于倍增思想的后缀排序算法。其中倍增思想在集训队论文中讲得很好,在此不再赘述。这里主要讲代码实现。constintN=2e6+10;chars[N];intn,m,sa[N],rk[N],tp[N],b[N];void......
  • 2024牛客寒假算法基础集训营1
    2024牛客寒假算法基础集训营1A解题思路:按照\(dfs\)出现顺序暴力判断即可。代码:#include<bits/stdc++.h>usingnamespacestd;usingll=longlong;usingpii=pair<ll,ll>;#definefifirst#definesesecondusingi128=__int128_t;usingpiii=pair<ll,pai......
  • 图论笔记
    最短路相关最短路基础\(\mathbf{Floyed}\)求最短路本质上是dp。设\(f(w,i,j)\)表示当前松弛到第\(w\)轮,\(i\rightarrowj\)的最短路是\(f(w,i,j)\)。转移显然是:\[f(w,i,j)=f(w-1,i,k)+f(w-1,k,j)\]\(w\)显然可以滚掉。时间复杂度\(O(n^3)\)......
  • 游戏项目的压力测试
    压力测试是,给游戏进程增加并发量,强制其在高负载下运行,并观察进程性能的测试;其中游戏进程包括服务器和客户端进程。当游戏负载过高导致性能不足时,会造成进程卡顿或崩溃,甚至引发逻辑漏洞造成产品损失。因此压力测试是游戏功能外放前非常重要的一个步骤,关系到玩家体验和游戏口碑。作......
  • (视频)嵌入式学习
    嵌入式开发开发环境交叉开发环境:串行、局部以太网、OCD链接在一起,内部通过通信协议建立逻辑链接特点:运行在不同环境可以独立运行调试器完成装载外部通信调试器发出调试信号可以调试不同指令集兼有编译器:Glibc,KEIL调试方式插桩:增加一些器件,实现交叉调试片上调试:在......
  • 超级英雄
    这道题目从感觉上来看,应该是匈牙利的模板的过程中,如果遇到某个点找不到增广路,直接结束循环,即for(inti=1;i<=m;i++){ memset(vis,0,sizeof(vis)); if(dfs(i))ans++; elsebreak; }事实上,这确实是答案,那么为什么是对的?我暂时不能直接从图论的角度给......