首页 > 其他分享 >KingbaseESV8R6识别IO使用率过高

KingbaseESV8R6识别IO使用率过高

时间:2023-09-18 13:46:34浏览次数:58  
标签:checkpoint stat autovacuum KingbaseESV8R6 sys 检查点 IO vacuum 使用率

前言

数据库正常运行离不开I/O的使用,在操作系统上,I/O又离不开存储的性能及使用方式,我们可以在存储层利用raid条带化技术使IOPS达到最佳性能。

本篇文章有助于确认数据库I/O使用率过高的原因 ,以及解决方法。

确定I/O使用率过高的原因

1.需要数据库内置的sys_stat_statements扩展

并需要开启

track_io_timing = on

track_wait_timing = on

参考官方文档:https://help.kingbase.com.cn/v8/perfor/performance-optimization/performance-optimization-6.html?highlight=_stat_statements

使用以下语句查看使用 I/O 消耗前五 SQL 语句:

SELECT userid::regrole, dbid, query
FROM sys_stat_statements 
ORDER BY blk_read_time + blk_write_time desc  
LIMIT 5;   

2.长时间运行的事务

长时间运行的事务可能导致 I/O 使用率过高。

以下sql有助于查看运行时间最长的连接:

SELECT pid, usename, datname, query, now() - xact_start as duration 
FROM sys_stat_activity  
WHERE pid <> sys_backend_pid() and state IN ('idle in transaction', 'active') 
ORDER BY duration desc;   

3.检查点消耗的I/O

数据库生成检查点会将脏块写入磁盘,为了数据安全而持久化数据。这个过程需要消耗I/O资源。有时可以从sys_log日志中看到,“检查点过于频繁的字样”,或者从数据库日志中看到checkpoint_write耗时过长。

通过sys_stat_bgwriter 显示有关后台写进程的活动的统计信息。可以计算已经被执行的计划中检查点的数量,在文件被写入磁盘的检查点处理部分花费的总时间等,详情可参考官方文档 https://help.kingbase.com.cn/v8/admin/reference/ref-database-parameter/ref-dynamic-performance-views/sys_stat_bgwriter.html?highlight=sys_stat_bgwriter

4.vacuum消耗I/O

vacuum是数据库中的重I/O操作,由于MVCC特性,vacuum操作不可避免。

以下语句帮助查看vacuum的发生频率。

SELECT schemaname, relname, n_dead_tup, n_live_tup, autovacuum_count, last_vacuum, last_autovacuum, last_autoanalyze, autovacuum_count, autoanalyze_count 
FROM sys_stat_all_tables WHERE n_live_tup > 0; 
  • last_autovacuum:上次 autovacuum 在表上运行的日期和时间。
  • autovacuum_count:autovacuum表的次数。
  • autoanalyze_count:autoanalyze表的次数。

解决 I/O 使用率过高的问题

1.EXPLAIN ANALYZE 命令进一步查询sql的执行机会,并对其进行优化。

2.终止长时间运行的事务

若要终止会话的进程 PID,需要使用以下查询:

SELECT pid, usename, datname, query, now() - xact_start as duration 
FROM sys_stat_activity  
WHERE pid <> sys_backend_pid() and state IN ('idle in transaction', 'active') 
ORDER BY duration DESC;   

还可以按其他条件进行筛选,例如 usename(用户名)或 datname(数据库名称)。

获取会话的 PID 后,可以使用以下语句终止它:

SELECT pg_terminate_backend(pid);

3.参数优化

如果观察到检查点发生频率过高,可以增大 max_wal_size 参数。两个检查点之间的间隔应该接近服务器上设置的 checkpoint_timeout 值。

通过以下方法设置max_wal_size一个合理的值:

运行以下查询以获取当前的 WAL LSN,然后记下结果:

select pg_current_wal_lsn();

等待 checkpoint_timeout 设置的秒数。 然后运行以下查询以获取当前的 WAL LSN,然后记下结果:

select pg_current_wal_lsn();

运行以下查询,计算两个lsn结果差值(以 GB 为单位):

select round (sys_wal_lsn_diff ('LSN value when run second time', 'LSN value when run first time')/1024/1024/1024,2) WAL_CHANGE_GB;
  • checkpoint_completion_target:建议将值设置为 0.9。 例如,为 10 分钟的 checkpoint_timeout 使用值 0.9 表示完成检查点的目标是 540 秒(0.9*600 秒)。 值 0.9 可作为 I/O 负载的评估值。 使用更激进的 checkpoint_completion_target 值可能导致服务器上的 I/O 负载增加。

  • checkpoint_timeout:可以增大 checkpoint_timeout 值,而不是使用默认值。 增大该值时,虽然I/O负载会降低,但也请考虑到会增大故障恢复时间。

4.优化 autovacuum 进程

持续运行自动清理任务可能会影响服务器上的 CPU 和 IO 使用率。 可能的原因如下:

如果 maintenance_work_mem 较低,则可将此参数增加到 2 GB。 一般的经验是,为每 1 GB 的 RAM 分配50MB的maintenance_work_mem 。

自动清理任务每隔 autovacuum_naptime 秒尝试在每个数据库上启动一个worker。

例如,如果一个服务器有 60 个数据库并且 autovacuum_naptime 设置为 60 秒,那么自动清理woker每秒启动一次 [autovacuum_naptime/DB 数]。

如果有最老事务阻止了vacuum的进行,那么vacuum worker会在表上做无用功,这也是需要消耗I/O的,所以对于未结束的长事务我们需要重点监控。

5.使用高性能存储,扩展磁盘IOPS能力。

标签:checkpoint,stat,autovacuum,KingbaseESV8R6,sys,检查点,IO,vacuum,使用率
From: https://www.cnblogs.com/kingbase/p/17711660.html

相关文章

  • KingbaseESV8R6延迟提交参数
    前言队列理论在我们生活中的应用随处可见,例如我们去食堂打饭需要排队,我们生活中随处可见排队的场景。在计算机领域中,性能诊断等地方使用队列理论的案例也很多。服务器硬件分为动态设备和静态设备。CPU和IO子系统属于动态设备,RAM属于静态设备,队列理论只对动态设备适用。Kingbase......
  • KingbaseESV8R6使用kbbench计算连接耗时
    前言本文讨论一下KingbaseESV8R6数据库中如何计算数据库连接耗时。有这样一个场景,不借助第三方工具,在数据库服务端计算1000个数据库连接的总耗时,并取得每个连接耗时的平均值。怎样实现呢?我们可以借助kbbench工具。这是Kingbase数据库自带的一款客户端工具。kbbench介绍kbbench......
  • KingbaseESV8R6中查看索引常用sql
    前言KingbaseES具有丰富的索引功能,对于运行一段时间的数据库,经常需要查看索引的使用大小,使用状态等。尤其重复索引的存在,有时会因为索引过多而造成维护成本加大和减慢数据库的运行速度。下面是经常使用的查看索引的sql。1.查看表上索引个数,是否唯一,表与索引大小。SELECTCO......
  • KingbaseESV8R6全局临时表不能进行reindex操作
    背景我们经常遇到两种情况下会重建索引,reindex1、索引崩溃,由于软件或硬件问题导致索引内数据失效而不可用。2、索引膨胀,当索引膨胀会占用过多磁盘空间,reindex可以解决此问题。对于临时表和全局临时表而言,临时表可以进行reindex操作,而全局临时表不能进行此操作,原因是全局临时表......
  • yarn 出现 【 info There appears to be trouble with your network connection. Retr
    第一种解决方案#调整为taobao镜像源yarnconfigsetregistryhttps://registry.npm.taobao.org我用了没用,可以试试第二种解决方案要在项目根目录下创建后缀名为.yarnrc的文件,并设置network-timeout的值为600000,你可以按照以下步骤进行操作:打开文本编辑器,例如Note......
  • IPQ6010 IPQ6018 WiFi6 2X2 QSDK OpenWiFi Cloud AP AC Customizable Solution
    IPQ6010IPQ6018WiFi62X2QSDKOpenWiFiCloudAPACCustomizableSolutionWiFi6,alsoknownas802.11ax,representsthelatestgenerationofwirelessnetworkingtechnology.Itbuildsuponthefoundationestablishedbyitspredecessor,WiFi5(802.11ac),an......
  • 用ME_CONFIRMATION_UPDATE处理采购订单行项目确认视图
    用function module:ME_CONFIRMATION_UPDATE,可以处理采购订单行项目确认视图,实现增删改操作。 CALLFUNCTION'ME_CONFIRMATION_UPDATE'EXPORTINGI_EBELN="采购订单号TABLESXEKES="对应新增和修改YEKES=......
  • visual studio2019突然只能打字不能使用回车键、退格键解决办法
    然后重启vs就好了…......
  • 展会预告 | 图扑邀您共聚 IOTE 国际物联网展·深圳站
    参展时间:9月20日-22日图扑展位:9号馆9B35-1参展地址:深圳国际会展中心(宝安新馆)IOTE2023第二十届国际物联网展·深圳站,将于9月20日-22日在深圳国际会展中心(宝安)9、10、11号馆震撼来袭。本届展会以“IoT构建数字经济底座”为主题,将IoT技术引入实体经济领域,促进数字......
  • 计算机视觉算法中的视频摘要(Video Summarization)
    引言随着数字视频内容的爆炸式增长,如何高效地获取视频的关键信息成为了一个重要的问题。视频摘要(VideoSummarization)作为计算机视觉领域的一个重要研究方向,旨在通过自动化方法从长时间的视频中提取出关键的、代表性的内容,以便用户能够快速浏览和获取视频的核心信息。本文将介绍视......