PostgreSQL死锁案例分析(二）

PostgreSQL死锁案例分析(二）

原作者：陈雁飞　创作时间：2019-09-26 15:28:14+08 采编：wangliyun

发布时间：2019-09-27 08:08:14

欢迎大家踊跃投稿，投稿信箱：press@postgres.cn

评论：1 浏览：4684

2019-09-01 21:01:08.359 CST [1482] ERROR:  deadlock detected
2019-09-01 21:01:08.359 CST [1482] DETAIL:  Process 1482 waits for ShareLock on transaction 523; blocked by process 1610.
        Process 1610 waits for ShareLock on transaction 524; blocked by process 1482.
        Process 1482: select test2.a,test2.b,test2.c from test2 join test1 on test2.a = test1.a where test2.b = 2 and test1.c = 3 for update;
        Process 1610: delete from test1 where a = 1;
2019-09-01 21:01:08.359 CST [1482] HINT:  See server log for query details.
2019-09-01 21:01:08.359 CST [1482] CONTEXT:  while locking tuple (0,1) in relation "test1"
2019-09-01 21:01:08.359 CST [1482] STATEMENT:  select test2.a,test2.b,test2.c from test2 join test1 on test2.a = test1.a where test2.b = 2 and test1.c = 3 for update;

create table test1(a int primary key, b int, c int);
create table test2(a int references test1 on delete cascade,b int, c int);

insert into test1 values(1,2,3),(2,3,4),(3,4,5);
insert into test2 values(1,2,3),(2,3,4),(3,4,5);

CENTER_PostgreSQL_Community

CENTER_PostgreSQL_Community

CENTER_PostgreSQL_Community

CENTER_PostgreSQL_Community

test = table_tuple_lock(erm->relation, &tid, estate->es_snapshot,
                    markSlot, estate->es_output_cid,
                    lockmode, erm->waitPolicy,
                    lockflags,
                    &tmfd);

CENTER_PostgreSQL_Community

CENTER_PostgreSQL_Community

CENTER_PostgreSQL_Community

CENTER_PostgreSQL_Community

标签：test1,test2,PostgreSQL,案例,死锁,01,TEST2,操作
From： https://www.cnblogs.com/yaoyangding/p/16942415.html

PostgreSQL死锁案例分析(二）

PostgreSQL死锁案例分析(二）

PostgreSQL死锁案例分析(二）

PostgreSQL死锁案例分析(二）

作者介绍

陈雁飞，开源PostgreSQL爱好者，一直从事PostgreSQL数据库运维工作

问题现象

接前一篇文章，这里继续介绍在工作中遇到的一个死锁案例。经过对业务模型的抽取分析（后面会介绍表结构和数据，业务模型来源于开源组件的实际业务），模拟得到的死锁日志信息如下：

从数据库日志上看，记录的SQL语句涉及两张表TEST1和TEST2，其中一个事务执行的SQL是SEELCT … FOR UPDATE用于获取行级锁操作。

流程梳理

经分析，事务操作涉及两张表，简化后的表结构以及操作逻辑如下：

表TEST1

表TEST2

由于是涉及到行级锁的操作，需要借助gdb工具进行调试，控制事务2获取锁的逻辑顺序。首先，根据执行计划信息，找到加载的行级锁的函数。

在数据库中，SQL的执行按照生成的执行计划完成的，该执行计划中最顶层算子是LockRows，对应到执行器中的函数是ExecLockRows，结合代码，对行级元素加锁的操作如下：

因此，使用gdb调试工具在该处函数加上断点，erm记录请求行级锁对应的表信息。操作结果如下：

可以看到对应表OID为16389，查询数据库该对应的表为TEST2，表明此时事务二已经获取到TEST2对应结果的行级锁信息，此时继续执行事务一中的删除操作，该事务将被阻塞。

调试工具中继续执行事务二操作之后，出现前文中描述的死锁信息，如下：

表明事务二中执行的语句先获取TEST2的行锁，然后获取TEST1的行锁，与事务一种的操作获取锁顺序正好相反，由于操作的是相同行，从而导致了死锁发生。

进一步分析

总结

相关文章

赞助商

阅读排行