导读
Hi,大家好!我是白日梦!本文是MySQL专题的第 24 篇。
今天我要跟你分享的MySQL话题是:“从一条update sql执行都经历什么开始,发散开一系列的问题,看看你能抗到第几问吧”
换一种写作风格,自导自演面试现场!感觉这样还是比较有趣的,欢迎大家订阅我的MySQL专题,公众号持续更新中~
欢迎关注白日梦,公众号首发!持续连载中
1
好!我们开始吧!
Hi同学,听说你上一面表现的还可以,这一面要不咱继续?
嗯,好啊!
好,你说一下一条update sql的执行,都经历了哪些阶段吧
我可以画一张简图,然后我们一起看一下这张脑图吧
你可以花几秒看下这个图哦
嗯,你继续!
一般在我们的后端系统中,和数据库打交道都逻辑都放在DAO层,DAO层的持久化框架中封装了:数据驱动(Driver),SQL语句一般也都是由DAO层的持久化框架发送给数据库的。
嗯,那你说的DAO层就是上图中的客户端了吧
Server层和InnoDB层。你说说看!
是的,通常大家会把数据库分层两部分,上层的Server层和下层的存储引擎层。
总的来看:Server层主要是负责和客户端建立网络连接,接受客户端传递过来的SQL、预处理、由执行器发送给储存引擎执行。
而存储引擎会和操作系统的文件系统打交道。
对于MySQL来说存储引擎是可插拔的。
嗯,你说的没错
!那如果我让你写一个MySQL的Server层。
你有什么思路吗?说说看!
我
.....
有思路
,下面我用大白话简单描述一下:
你知道的!MySQL被吹的再神,本质上不过是个软件而已
,而且Server层的功能相对来说比较简单,主要就是接受客户端的连接,拿到网络包中的SQL语句,然后处理......
并且它是单进程多线程的软件,通常会占用3306端口启动,那我完全可以一比一写出一个MySQL Server层嘛!
比如我可以用熟悉的编程语言,TCP编程,写个TCP - Server端,监听3306端口启动。然后从接收到的数据包中取出数据,按照MySQL协议解析数据,得到SQL语句。再处理SQL语句就是了!
白日梦补充:欢迎关注我的公众号,我特希望出一套视频课,从0开始,手撸出一个数据库中间件(有读写分离、权限管理、事务能力)。让每个加入白日梦的圈子的人都吃透数据库中间件!
对某个数据库中间件特别熟悉
)
你整体的思路是没问题的!
回到正题,继续说update sql如何被处理。
好
,我们的应用程序把SQL发送给Server层后,SQL会陆续被分析器、优化器、执行器处理。
查询缓存。这个查询缓存由Server层维护,它设计的初衷就是在内存中暂存原来查询的结果。以便下次查询时可以快速得到结果^_^
但是它有个缺点就是当有对该表的更新操作时,该表的查询缓存会被废弃。所以MySQL8中将查询缓存砍掉了。
嗯,继续。
嗯嗯,那我继续往下说。
分析器的作用:对SQL进行语法、词法上的分析。
优化器的作用:生成执行计划、选择索引。
执行器的作用:操作执行引擎,获取SQL的执行结果。
那我现在就让你实现这个分析器!
task is cheap,show me the code!
,可以下看面的Case。
好
,这个话题过
。
你继续往下说。
我们的update sql经过server层的分析检测之后,最终由执行器交由存储引擎执行。
因为InnoDB是支持事务的,而我们现在是update类型的SQL,所以会被放在一个单独的事务中去执行。
为了提供事务回滚的能力,于是有了上图中的第5步,InnoDB存储引擎会先写undo log。
白日梦补充:
简介undo log、truncate、以及undo log如何帮你回滚事物?
写完undo log之后,整体的执行流程会来到图中的第6步。
在BufferPool缓存池中对内存中的数据进行update。
Buffer Pool缓存池?那我得问下
这个Buffer Pool缓存池是啥?
查询缓存呀,它和BufferPool缓存池啥区别?
嗯,是这样的。 首先我们都知道,MySQL是支持持久化的,数据最终都落在磁盘上。
但是如果所有的update sql 都直接、大量、频繁的进行IO磁盘操作,会导致MySQL整体的性能极具下降。
现在MySQL实现方式是:它在内存中对数据进行CRUD,所以在图中可以看到,BufferPool中的数据是从磁盘上读进去的。
在内存中CRUD就能获得最大的性能。后续再通过一定的机制将数据刷新回磁盘中。
白日梦补充:
用十一张图讲清楚,当你CRUD时BufferPool中发生了什么!以及BufferPool的优化!
小伙子可以!继续说!
当update sql修改完内存中的数据后,接下来就是提交事务了。提交事务的方式一般都是两阶段提交。
也就是:
1、先写redo log(prepare)
2、写binlog
3、写redo log (commit)
这些日志后续也都会有一定的机制控制把它们持久化到磁盘中。
白日梦补充:
了解bin log的写入机制吗?说说你们线上如何调整参数的!
那你说一下redo log、bin log分别给了MySQL什么能力吧
搭建集群、数据备份、数据恢复、审计的能力啊
崩溃恢复的能力。
redolog的崩溃恢复的呢?
binlog 有redolog 崩溃恢复的能力嘛?
嗯~,我是这样理解的:binlog由MySQL的上层也就是Server层记录。
可以看下这张图:截自部分binlog
可以看到binlog中记录的是sql语句,记录这你对哪张表的id=xx的行做了什么样的修改。
像数据表啊、行啊这都是一些只存在于逻辑上概念。
而redolog中记录的是物理层面的概念。比如redo log中会记录你对xxx表空间的XXX数据页xxx偏移量的地方做了XXX更新。
所以说,binlog的数据恢复和redo log的崩溃恢复其实是发生在两个层面的,完全是两码事的!
就像是上图那样,binlog的中不是记录着SQL吗?所以可以把借助binlog的实现的数据恢复理解成回放binlog中的SQL。
而redolog的崩溃恢复指的是当MySQL出现异常Crash重启后,将内存中数据恢复成崩溃前的脏数据
嗯!了解
,整体上看你的回答的还可以!
我没有问题了,你还有什么想问我的吗?
没有问题了,感谢大佬百忙抽空来给我面试!
好好准备,期待你下一面优秀的表现
最后,欢迎关注白日梦的公号哦~
换一种写作风格,自导自演面试现场!感觉这样还是比较有趣的,欢迎大家订阅我的MySQL专题,持续更新中~
标签:binlog,log,MySQL,update,Server,面试,sql,SQL From: https://blog.51cto.com/u_15311508/7035348