问题描述

20231127上午客户反馈绩效系统20231125、20231126出现2次YAS-02020 snapshot too old的问题，测试也有类似问题。

该过程是客户新增的存储过程，目的是通过PRO_RUN_JOB作为主控，调度其他存储过程，后续不用其他调度引擎。

原因分析

错误信息收集分析

分析存储过程报错日志，核查UNDO_RETENTION、undo表空间

看了相应的优化建议，可以增大参数UNDO_RETENTION的值，或者使用更大的undo表空间。

客户环境目前UNDO_RETENTION配置了600，该参数单位是秒。临时修改客户测试环境的配置为3000，试图规避问题。

正常理解，MVCC用于高并发的情形，会出现该错误，而该存储过程执行是串行的，不符合预期！需要继续分析。

UNDO、MVCC机制分析

了解背后机制，snapshot too old是由于db需要做多版本控制（mvcc），在数据commit之后，仍然会保留undo一段时间，在超过这段时间之后undo的空间会被复用，如果需要还原的数据超过了这个时间，则还原不了，触发该错误。

崖山db快照隔离级别的核心就是MVCC（Multi-Version Concurrency Control）,多版本并发控制

快照本质上就是一个时间点。记录版本的时间点为事务提交的时间点。

可见性可分为2类情况：

1、事务内的语句可见性

2、事务间的可见性

由于老版本保留时间的限制，我们可能无法读取到某些很老的版本，这时就会有snapshot too old错误。

事务功能梳理 - YashanDB

可以确认：

不同事务间，特别是长查询，容易出现该问题；
另一个是专门的快照读，如Oracle的快照读select count(*) from tableA as of timestamp to_timestamp('2013-10-16 08:46:57','yyyy-mm-dd hh24:mi:ss');

疑点一

分析测试环境出现过类似的问题，看到报错的时间点：

2023/11/23 13:21:52执行的是PRO_DAILY_DPSIT

2023/11/23 12:04:00执行的是PRO_SYS_USER_POST_REL

有个共同点：

PRO_SYS_USER_POST_REL用的是merge，同时读和写同个表

PRO_DAILY_DPSIT用的是insert into select，insert 和select的表有相同的

开始怀疑这里有并发机制，读写自同个表，但是作为同个事务内的，undo不应该被释放掉，不符合预期！

确认问题

剩下的就是长查询的可能。只有在查询的时候才会报这个错误，update的时候是不会报这个错误的。

继续分析游标loop的结果，如果在游标读取的时候报错，则remark也是：更新跑数任务明细表：单个任务成功结束的相关信息

fetch在一开始就拿到scn（SCN即系统改变号（System Change Number）），每次fetch都用的open时的scn，由于loop过程中还是update RUN_JOB_DETA表更新了db存储的某一个block，commit之后undo的数据会保留undo_retention的时间，当超过这个时间undo的空间会别其他任务复用。

而一个block不止一条数据，在后续loop的过程，如果继续读取到这个block的数据，需要对这个block还原到scn对应的状态再读取，由于undo已经被复用，就会报snapshot too old的错误。

undo机制、MVCC机制，在Oracle、DB2中都是有的，该问题也会存在。崖山的数据块不会存2个表的数据，可以使用下面方法规避：

PRO_RUN_JOB这个存储过程使用游标读取RUN_JOB_DETA表做为配置表，loop过程中需要更新的结果数据放到历史表（主要更新任务状态，开始、结束时间，耗时），配置表和历史结果分开存储，彻底解决问题。

经验教训

Undo机制中，undo_retention是一个不容易理解的参数项。设置之后，Oracle会根据自动undo管理的原则进行调节，进行空间拓展，来适应实现用户的期间要求。而崖山db需要根据实际的业务频繁度和数量量、以及undo表空间设置情况进行综合评估。
存储过程存在游标遍历，需要注意更新目标表不是fetch的表，否则存在类似问题。

标签：存储,YashanDB,PRO,undo,报错,too,old,snapshot
From： https://www.cnblogs.com/YashanDB/p/18305654

GLM-4-9B-Chat WebDemo 部署报错：ValueError: too many values to unpack
用开源大模型食用指南self-llm项目的GLM-4-9B-ChatWebDemo部署文档部署时遇到如下错误：ValueError:toomanyvaluestounpack(expected2)Traceback:File"/root/miniconda3/lib/python3.10/site-packages/streamlit/runtime/scriptrunner/script_runner.py",line552,......
报错\corelibrary\think\cache\driver\File.php
这个错误通常发生在尝试使用 unserialize() 函数反序列化一个存储的缓存数据时，但提供的缓存数据无法被正确解析。在 \core\library\think\cache\driver\File.php 文件的第117行左右，框架尝试从文件中读取缓存数据并反序列化它。以下是一些可能的解决方案：检查缓存文件内容：首......
Pandas运行报错分析：ValueError: Length mismatch: Expected axis has 0 elements, new
✨✨欢迎大家来到景天科技苑✨✨......
《战地2042》DX报错无法启动游戏怎么处理，战地2042启动游戏DX报错解决方法
《战地2042》作为一款以现代战争为题材的、大规模的、可供多人在线游玩的第一人称射击游戏，其在上线初期以及后续的运营期间，有部分玩家在启动游戏时遇到了与DirectX有关的错误提示，以致无法顺利进入游戏。DirectX，又称DX，它是由微软公司推出的一套多媒体编程接口，主要用于处理游戏......
《死亡搁浅》DX12报错怎样处理，游戏DX12报错解决教程详解
《死亡搁浅》作为一款广受瞩目的开放世界动作冒险游戏，凭其独特剧情设定、精细画面呈现和创新游戏玩法吸引了全球大量玩家。然而在PC平台上，部分玩家尝试运行此游戏时却遭遇和DX12有关的报错问题，致使游戏无法正常启动或运行中频繁崩溃。本篇将为大家带来《死亡搁浅》DX12报错解决......
《火影忍者：究极风暴4》DX11报错令游戏崩溃怎样处理，火影忍者究极风暴4DX11报错游戏崩溃
《火影忍者：究极风暴4》DX11报错致使游戏崩溃，这可让玩家们犯了难。究竟该如何解决这个棘手的问题呢？本篇文章将为大家带来火影忍者究极风暴4DX11报错游戏崩溃解决办法，感兴趣的小伙伴们一起来看看吧，希望能够帮助到大家。DX11报错游戏崩溃解决办法1、图形驱动更新：访问NVIDIA、A......
【YashanDB知识库】数据变化率超过阈值统计信息失效
【问题分类】性能优化【关键字】统计信息【问题描述】SQL--创建表结构droptablet1;createtablet1(idint,namevarchar2(200));createindext1_id_indont1(id);createindext1_name_indont1(name);--造数beginforiin1..100loopinsertintot1value......
docker centos7 镜像 systemctl 报错 Failed to get D-Bus connection: Operation not
从docker下载默认的CentOS镜像没有开启systemd,执行systemctl命令会显示“FailedtogetD-Busconnection:Operationnotpermitted”错误，如果docker创建centos7的容器涉及到systemctl服务操作，或者需要实现容器开机后自动启动服务功能。需要调整镜像并且修改镜像启动方式......
满满干活-wireshark进阶篇《Wireshark的TCP协议数据包常见报错提示》，练就你火眼金睛，助
文章目录概要1.TCPPORTNUMBERSREUSED当四元组相同时会出现报错2.TCPWINDOWFULL与TCPZEROWINDOW之你怎么还不回我啊与我不行了。3.TCPWindowUpdate之我又行了能工作了小结概要本文介绍Wireshark的数据包常见报错提示，包括TCPPORTNUMBERSREUSED和TCPW......
Linux 报错INFO: task blocked for more than 120 seconds
一般情况下，Linux会把可用内存的40%的空间作为文件系统的缓存。当缓存快满时，文件系统将缓存中的数据整体同步到磁盘中。但是系统对同步时间有最大120秒的限制。如果文件系统不能在时间限制之内完成数据同步，则会发生上述的错误。这通常发生在内存很大的系统上。系统......

【YashanDB知识库】存储过程报错snapshot too old