首页 > 其他分享 >tidb 6.1.4 table cache 导致的集群QPS异常问题

tidb 6.1.4 table cache 导致的集群QPS异常问题

时间:2024-04-12 10:22:05浏览次数:36  
标签:return nil err cache ctx 6.1 QPS lease

1. 问题现象

  1. TIDB日志中频繁的刷以下日志:

[2024/03/13 09:09:40.542 +08:00] [WARN] [cache.go:205] ["lock cached table for read"] [error="previous statement: update mysql.table_cache_meta set lock_type = 'READ', lease = 448342830925742080 where tid = 265617: [kv:9007]Write conflict, txnStartTS=448342833363681305, conflictStartTS=448342833363681293, conflictCommitTS=448342833363681328, key={tableID=57, handle=265617} primary={tableID=57, handle=265617} [try again later]"]
[2024/03/13 09:09:40.555 +08:00] [WARN] [session.go:1966] ["run statement failed"] [schemaVersion=313410] [error="previous statement: update mysql.table_cache_meta set lock_type = 'READ', lease = 448342830938849280 where tid = 265617: [kv:9007]Write conflict, txnStartTS=448342833363681354, conflictStartTS=448342833363681331, conflictCommitTS=448342833363681368, key={tableID=57, handle=265617} primary={tableID=57, handle=265617} [try again later]"] [session="{\n "currDBName": "",\n "id": 0,\n "status": 2,\n "strictMode": true,\n "user": null\n}"]

  1. 通过监控发现,出现大量的2PC阶段的失败和PrePareWrite 失败的情况。同时整个集群的QPS断崖式下降。

image.png

image.png

image.png

2. 问题分析

从监控上来看大量的请求是处于两阶段提交失败的情况,且失败的表是mysql.table_cache_meta。从6.0.0开始 ,TIDB新增了cache表功能,对于热点的小表可以缓存在内存中,增加访问的速度。但是为了保证各个TIDB节点之间的缓存一致性,TIDB实现了一个lease机制(来自官网文档):

缓存表的写入延时高是受到实现的限制。存在多个 TiDB 实例时,一个 TiDB 实例并不知道其它的 TiDB 实例是否缓存了数据,如果该实例直接修改了表数据,而其它 TiDB 实例依然读取旧的缓存数据,就会读到错误的结果。为了保证数据正确性,缓存表的实现使用了一套基于 lease 的复杂机制:读操作在缓存数据同时,还会对于缓存设置一个有效期,也就是 lease。在 lease 过期之前,无法对数据执行修改操作。因为修改操作必须等待 lease 过期,所以会出现写入延迟。

这里可以猜测引起问题的是在更新lease的阶段。在SQL Build的阶段会调用getCacheTable :

func (b *executorBuilder) getCacheTable(tblInfo *model.TableInfo, startTS uint64) kv.MemBuffer {
	tbl, ok := b.is.TableByID(tblInfo.ID)
	if !ok {
		b.err = errors.Trace(infoschema.ErrTableNotExists.GenWithStackByArgs(b.ctx.GetSessionVars().CurrentDB, tblInfo.Name))
		return nil
	}
	sessVars := b.ctx.GetSessionVars()
	leaseDuration := time.Duration(variable.TableCacheLease.Load()) * time.Second
	cacheData, loading := tbl.(table.CachedTable).TryReadFromCache(startTS, leaseDuration)
	if cacheData != nil {
		sessVars.StmtCtx.ReadFromTableCache = true
		return cacheData
	} else if loading {
		// continue
	} else {
		if !b.ctx.GetSessionVars().StmtCtx.InExplainStmt && !b.inDeleteStmt && !b.inUpdateStmt {
			tbl.(table.CachedTable).UpdateLockForRead(context.Background(), b.ctx.GetStore(), startTS, leaseDuration)
		}
	}
	return nil
}

这里有2个地方会去更新lease :

  1. TryReadFromCache

  2. UpdateLockForRead

在TryReadFromCache 中,当剩余过期时间小于1/2的lease的时候,会去尝试更新lease:

func (c *cachedTable) TryReadFromCache(ts uint64, leaseDuration time.Duration) (kv.MemBuffer, bool /*loading*/) {
	tmp := c.cacheData.Load()
	if tmp == nil {
		return nil, false
	}
	data := tmp.(*cacheData)
	if ts >= data.Start && ts < data.Lease {
		... ... 
		if distance >= 0 && distance <= leaseDuration/2 || triggerFailpoint {
			if h := c.TakeStateRemoteHandleNoWait(); h != nil {
				go c.renewLease(h, ts, data, leaseDuration)
			}
		}
		// If data is not nil, but data.MemBuffer is nil, it means the data is being
		// loading by a background goroutine.
		return data.MemBuffer, data.MemBuffer == nil
	}
	return nil, false
}

func (c *cachedTable) renewLease(handle StateRemote, ts uint64, data *cacheData, leaseDuration time.Duration) {
	... ...
	tid := c.Meta().ID
	lease := leaseFromTS(ts, leaseDuration)
	newLease, err := handle.RenewReadLease(context.Background(), tid, data.Lease, lease)
	... ...
}

func (h *stateRemoteHandle) RenewReadLease(ctx context.Context, tid int64, oldLocalLease, newValue uint64) (uint64, error) {
	var newLease uint64
	err := h.runInTxn(ctx, false, func(ctx context.Context, now uint64) error {
		lockType, remoteLease, _, err := h.loadRow(ctx, tid, false)
		if err != nil {
			return errors.Trace(err)
		}

		if now >= remoteLease {
			// read lock had already expired, fail to renew
			return nil
		}
		if lockType != CachedTableLockRead {
			// Not read lock, fail to renew
			return nil
		}

		// It means that the lease had already been changed by some other TiDB instances.
		if oldLocalLease != remoteLease {
			// 1. Data in [cacheDataTS -------- oldLocalLease) time range is also immutable.
			// 2. Data in [              now ------------------- remoteLease) time range is immutable.
			//
			// If now < oldLocalLease, it means data in all the time range is immutable,
			// so the old cache data is still available.
			if now < oldLocalLease {
				newLease = remoteLease
			}
			// Otherwise, there might be write operation during the oldLocalLease and the new remoteLease
			// Make renew lease operation fail.
			return nil
		}

		if newValue > remoteLease { // lease should never decrease!
			err = h.updateRow(ctx, tid, "READ", newValue)
			if err != nil {
				return errors.Trace(err)
			}
			newLease = newValue
		} else {
			newLease = remoteLease
		}
		return nil
	})

	return newLease, err
}

func (h *stateRemoteHandle) updateRow(ctx context.Context, tid int64, lockType string, lease uint64) error {
	_, err := h.execSQL(ctx, "update mysql.table_cache_meta set lock_type = %?, lease = %? where tid = %?", lockType, lease, tid)
	return err
}

如果在Build阶段发现lease过期了,则会调用UpdateLockForRead进行更新:

func (c *cachedTable) UpdateLockForRead(ctx context.Context, store kv.Storage, ts uint64, leaseDuration time.Duration) {
	if h := c.TakeStateRemoteHandle(); h != nil {
		go c.updateLockForRead(ctx, h, store, ts, leaseDuration)
	}
}

func (c *cachedTable) updateLockForRead(ctx context.Context, handle StateRemote, store kv.Storage, ts uint64, leaseDuration time.Duration) {
	... ... 

	// Load data from original table and the update lock information.
	tid := c.Meta().ID
	lease := leaseFromTS(ts, leaseDuration)
	succ, err := handle.LockForRead(ctx, tid, lease)
	if err != nil {
		log.Warn("lock cached table for read", zap.Error(err))
		return
	}
	... ... 
	// Current status is not suitable to cache.
}

func (h *stateRemoteHandle) LockForRead(ctx context.Context, tid int64, newLease uint64) ( /*succ*/ bool, error) {
	succ := false
	... ...

	err := h.runInTxn(ctx, false, func(ctx context.Context, now uint64) error {
		lockType, lease, _, err := h.loadRow(ctx, tid, false)
		if err != nil {
			return errors.Trace(err)
		}
		// The old lock is outdated, clear orphan lock.
		if now > lease {
			succ = true
			if err := h.updateRow(ctx, tid, "READ", newLease); err != nil {
				return errors.Trace(err)
			}
			return nil
		}

		switch lockType {
		case CachedTableLockNone:
		case CachedTableLockRead:
		case CachedTableLockWrite, CachedTableLockIntend:
			return nil
		}
		succ = true
		if newLease > lease { // Note the check, don't decrease lease value!
			if err := h.updateRow(ctx, tid, "READ", newLease); err != nil {
				return errors.Trace(err)
			}
		}

		return nil
	})
	return succ, err
}

func (h *stateRemoteHandle) updateRow(ctx context.Context, tid int64, lockType string, lease uint64) error {
	_, err := h.execSQL(ctx, "update mysql.table_cache_meta set lock_type = %?, lease = %? where tid = %?", lockType, lease, tid)
	return err
}

可以看到两个对lease的更新点,最后都会统一调用updateRow,并且在txn(事务中进行)。因为系统的默认tidb_table_cache_lease是3s,也就是说在1.5s之后,当select 语句使用到缓存表的时候,就会开始更新table_cache_meta表。

正常情况下往数据库系统的业务QPS可以达到40K-80K,因此每隔1.5s左右就需要更新一次lease,更新期间其他相同的请求会因为Write conflict而失败,因此导致整个系统的QPS断崖式下降。

问题处理

从分析来看有2个处理办法:

  1. 提高tidb_table_cache_lease的值: 不过根据分析来看,当剩余1/2 Lease的时候,在高QPS下,还是可能导致QPS抖动。

  2. 针对cache表,去掉cache,直接中TIKV读取数据。

当日在线上的处理操作是紧急去掉了cache ,系统即恢复正常。

参考文献

  1. 一篇文章说透缓存表 : https://tidb.net/blog/f663f0f5
  1. TiDB v6.0.0 DMR 源码阅读——缓存表: https://tidb.net/book/book-rush/features/new-features/new-cache-tables

标签:return,nil,err,cache,ctx,6.1,QPS,lease
From: https://www.cnblogs.com/bush2582/p/18130625

相关文章

  • QPS如何计算的
    QPS如何计算的目录QPS如何计算的什么是QPS?什么是TPS什么是PV计算关系计算步骤示例什么是QPS?QPS即每秒查询率,是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准。QPS=req/sec=请求数/秒即每秒的响应请求数,也即是最大吞吐能力。什么是TPS即服务器每秒处理......
  • MyBatis中如果某个查询不希望使用缓存,可以在映射文件中的select语句上设置flushCache=
    <selectid="xmlGetGuaranteeCount"databaseId="sqlserver"resultType="Integer"flushCache="true"><![CDATA[SELECTcount(appisparea.ID)FROMT_APP_ISP_ARE......
  • openGauss 支持global-syscache
    支持GlobalSysCache可获得性本特性自openGauss3.0.0版本开始引入。特性简介全局系统缓存(GlobalSysCache)是系统表数据的全局缓存和本地缓存。原理如图1所示。图1GlobalSysCache原理图客户价值全局系统缓存特性可以降低数据库进程的缓存内存占用,提升数据库的并发扩展......
  • 解释一下 "*.ts?(x)": [ "prettier --no-error-on-unmatched-pattern --cache --parse
    这段配置来自于一个项目的构建工具(如ESLint、Gulp、Webpack等)或者是一个任务运行器(如npmscripts、Makefile、gulpfile.js等)中的脚本命令,它通常是在lint-staged、husky等预提交钩子(GitHooks)配置中用来指定对特定类型文件进行格式化的指令。具体来说:"*.ts?(x)":这是一个glob......
  • 6.10物联网RK3399项目开发实录-驱动开发之SPI接口的使用(wulianjishu666)
    嵌入式实战开发例程,珍贵资料,开发必备:链接:https://pan.baidu.com/s/1149x7q_Yg6Zb3HN6gBBAVA?pwd=hs8b======================================================================SPI使用SPI简介SPI是一种高速的,全双工,同步串行通信接口,用于连接微控制器、传感器、存储设......
  • 什么是Redis?Redis为什么这么快?Redis相比Memcached有哪些共同点和区别?
    (1)什么是Redis?简述它的优缺点?Redis为什么这么快?Redis本质上是一个Key-Value类型的内存数据库,把整个数据库加载在内存当中操作,定期通过异步操作把数据库中的数据复制到硬盘中。(异步操作,一种非阻塞执行任务的方式,其中任务的执行与结果的返回不会阻碍原者继续执行后续操作。)优点......
  • 1、安装tbase5.21.6.1数据库
    目录安装tbase5.21.6.1数据库1、创建用户:2、创建目录3、安装3、查看安装的目录4、创建initdb5、修改配置文件5.1、修改postgresql.conf5.2、修改pg_hba.conf6、启动数据库7、创建group8、设置用户的密码安装tbase5.21.6.1数据库安装包版本:tbase_pgxz-5.21.6.1-i.x86_64.rpm1、......
  • Memcache分布式布置方案--一致性Hash分布机制PHP实现
    一致性Hash分布简介在服务器数量不发生改变时,普通的Hash分布可以很好地运作。当服务器的数量发生改变时,问题就出来了,试想,增加一台服务器时,同一个key经过Hash之后,与服务器取模的结果跟没增加服务器之前的结果会不一样,这就导致之前保存的数据丢失。为了把丢失的数据减少到最少,可以采......
  • 从系统cache中查看 tcp_metrics item
    从系统cache中查看tcp_metricsitemiptcp_metricsshow  tcp_metrics会记录下之前已关闭TCP连接的状态,包括发送端CWND和ssthresh,如果之前网络有一段时间比较差或者丢包比较严重,就会导致TCP的ssthresh降低到一个很低的值,这个值在连接结束后会被tcp_metricscache住,在新连接建......
  • 【26.1】Django框架之settings配置
    【一】引言Django项目的设置文件位于项目同名目录下,名叫settings.py。这个模块,集合了整个项目方方面面的设置属性,是项目启动和提供服务的根本保证。【二】简述settings.py文件本质上是一个Python模块,带有模块级别的变量。下面是一些示例设置:ALLOWED_HOSTS=['www.examp......