KingbaseES 避免wal日志占用大量磁盘空间

时间：2024-03-29 18:46:25浏览次数：20

背景

wal日志一直增长很快，查看归档目录也在执行归档，归档无异常，是归档执行太慢的原因吗？还是wal 日志生成的太快了的原因呢？现场环境wal日志的磁盘空间比较小。

分析

首先我们分析可否加速归档速度呢，因为如果能加快归档速度就可以缓解wal日志所在磁盘空间紧张的问题，答案是不可以。archive_command指定外部shell命令来进行归档，判定归档是否正常的方法，ps -ef 查看archiver 归档进程，查看archive_status目录下是否存在.ready的待归档wal文件，如果没有，只查看到.done结尾的文件，代表归档正常。我们没有办法通过增加归档进程或其他方式加快归档的速度。

那么，接下来，我们只能通过减少wal日志单位时间内的生成量或扩充磁盘空间来解决wal日志增长过快导致的磁盘空间紧张的问题。

wal日志保留数量和以下参数有关：
1、wal_keep_segments
2、max_wal_size
3、checkpoint的频度
4、复制槽

max_wal_size这个参数的意义是，当wal日志增长到这个参数的设定值就会触发检查点，也就意味着wal日志只能增长到这个参数设定值。但是，这个参数是个软限制，有些场景可能会超过这个参数的设定值，例如archive_command命令失败，或wal_keep_segments设置过大，或业务系统非常繁忙，单位时间内激增wal日志。当发生检查点时，对应脏块已经写入到磁盘，意味着检查点之前的wal日志不再需要，但并不意味着这些wal日志马上被清理，这需要一定的清理时间，这在数据库内部有判断机制。

wal_keep_segments 可以保留一定的wal日志，保证流复制过程中,如果standby节点失败后的,重新建立时,保证有一定的日志恢复standby节点。

wal日志和检查点：

检查点的作用是将数据库缓冲区中的脏页持久化到磁盘，也就是刷脏页。检查点函数会检测两次 checkpoint 的间隔（默认300毫秒）、或客户端请求 checkpoint 命令操作时执行检查点，
当发生检查点时，大体流程将内存中的 page 脏数据进行持久化、同时将当前执行 checkPoint 点对应 xlog 记录 lsn 保存到控制文件中。这里实现了下面几个重要功能：
1、脏页刷入。
2、删除或回收旧WAL：创建检查点后此位置之前的WAL不再需要，可以删除。
3、设置实例恢复起点。
4、更新控制文件中检查点信息，记录本次 CheckPoint 信息，以便实例崩溃恢复时做判断。

总结

以上分析的第二步，检查点的生成确实对删除wal日志有帮助，可实际并非如此，每次检查点后都会进行全页写，检查点后，第一次修改的数据库进行全页写。而全页写占用的wal日志量是非全页写的3倍左右。所以checkpoint_timeout参数需要根据实际业务场景酌情设置，不能设置太频繁，一般建议设置20-60min。在保证复制槽正常使用状态下，我们可以降低wal_keep_segments，max_wal_size参数设置以降低wal日志的占用的磁盘空间。Kingbase数据库没有办法对wal日志目录做大小硬限制，所以建议结合业务系统实际情况设置以上参数，保证wal日志所在磁盘空间充足。最后，无论wal日志还是归档所在目录的磁盘，需保证IO性能良好。

标签：wal,磁盘空间,参数,检查点,归档,日志,KingbaseES
From： https://www.cnblogs.com/kingbase/p/17921548.html

KingbaseES 普通用户逻辑导入时权限不足错误
逻辑导入时权限报错：ERROR:mustbememberofrole"system"实验：1、在超级用户system下新建用户与schema：createuseruser1;createschemas1;修改user1的默认权限：test=#alterdefaultprivilegesinschemas1grantallontablestouser1;ALTERDEFAULTPRIVILEGESt......
KingbaseES V8R3集群运维案例之---集群启动“DATA_SIZE_DIFF 16 (MB)”故障
案例说明：为保证集群数据的一致性安全，在主备库的数据相差“DATA_SIZE_DIFF>=16M"以上时，该备库不能参与主备切换，并且通过kingbase_monitor.sh启动集群时，集群将无法启动；本案例对此种故障做了复现，并测试了解决方法。适用版本：KingbaseESV8R3适用版本：KingbaseESV8R3一、案例......
KingbaseES V8R3备份恢复案例之---backup_label does not exist in KINGBASE_DATA
案例说明：在KingbaseESV8R3集群主库执行sys_rman的全备时，出现‘backup_labeldoesnotexistinKINGBASE_DATA’的故障，如下图所示：适用版本：KingbaseESV8R3一、问题现象如下所示，数据库执行sys_rman物理备份：[kingbase@node201bin]$./sys_rman-Usystem-W123456-dtes......
KingbaseES集群运维案例之-- V8R3与V8R6集群wal函数应用
案例说明：KingbaseESV8R3和V8R6集群在通过函数获取wal日志的相关信息时，两个版本的函数名称不同，本案例做了函数应用的对比和总结。适用版本：KingbaseESV8R3/R6一、KingbaseESV8R3相关函数Tips：在V8R3的版本，事务日志名称为xlog。1、查询数据库支持的函数test=#selectpron......
kingbaseES V8R6集群运维案例之---配置priority防止failover切换案例
案例说明：在一主多备的架构中，需要配置一台备库在主备切换时，不能选举为主库。对于repmgr主备切换主库的选择算法如下：Tips：Repmgr选举候选备节点会以以下顺序选举：LSN---->Priority---->Node_ID。系统会先选举一个LSN比较大者作为候选备节点；如LSN一样，会根据Priority优先级进行比......
KingbaseES V8R6集群运维案例之---级联备库upstream节点故障
KingbaseESV8R6集群运维案例之---级联备库upstream节点故障案例说明：在KingbaseESV8R6集群，构建级联备库后，在其upstream的节点故障后，级联备库如何处理？适用版本：KingbaseESV8R6集群架构：案例一：一、配置集群的recovery参数（allnodes）Tips：关闭备库的aut-recovery机制......
skywalking 服务搭建
1、下载skywalking服务https://archive.apache.org/dist/skywalking/9.3.0/apache-skywalking-apm-9.3.0.tar.gz1.1、解压tar-zxvfapache-skywalking-apm-9.3.0.tar.gz1.2、启动服务shbin/start.sh2、下载skywalking-agent服务https://archive.apache.org/dist/skywa......
启动应用程序出现FirewallAPI.dll找不到问题解决
其实很多用户玩单机游戏或者安装软件的时候就出现过这种问题，如果是新手第一时间会认为是软件或游戏出错了，其实并不是这样，其主要原因就是你电脑系统的该dll文件丢失了或没有安装一些系统软件平台所需要的动态链接库，这时你可以下载这个FirewallAPI.dll文件(挑选合适的版本文件)把......
Linux系统通过firewall限制或开放IP及端口
一、查看防火墙状态1、首先查看防火墙是否开启，如未开启，需要先开启防火墙并作开机自启systemctlstatusfirewalld开启防火墙并设置开机自启systemctlstartfirewalldsystemctlenablefirewalld一般需要重启一下机器，不然后面做的设置可能不会生效二、开放或限制端口1、开放端......
KingbaseES生成动态SQL
1.动态SQL动态SQL在程序启动时会根据输入参数替换相应变量。使用动态SQL可以创建更强大和灵活的应用程序，但在编译时SQL语句的全文不确定，因此运行时编译会牺牲一些性能。动态SQL可以是代码或SQL语句的一部分，动态部分要么由开发人员输入，要么由程序本身创建。1.1动态SQL使用场景......

KingbaseES 避免wal日志占用大量磁盘空间

背景

分析

总结

相关文章

赞助商

阅读排行