首页 > 其他分享 >分页查询出现数据重复或丢失,你遇到过吗?

分页查询出现数据重复或丢失,你遇到过吗?

时间:2023-03-22 23:36:53浏览次数:39  
标签:03 00 分页 create 查询 丢失 time order

一、问题背景

最近部分销售人员反馈在 APP 上查询自己名下客户订单数据时,当往下拉取数据的时候,列表上经常出现重复的订单数据,经过排查,后端代码是通过如下方式来实现数据的分页查询的。

limit offset, size order by create_time desc

经过细致的分析,这种排序方式,在 app 端分页查询的时候,确实存在问题

详细的分析过程如下!

二、原因分析

首先我们初始化一张表,用于模拟订单表查询。

CREATE TABLE `tb_order` (
  `order_id` bigint(11) unsigned NOT NULL,
  `create_time` datetime DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

然后初始化 5 条数据进去,方便数据分析

INSERT INTO `tb_order` (`order_id`, `create_time`) VALUES (1, '2023-03-03 12:00:01');
INSERT INTO `tb_order` (`order_id`, `create_time`) VALUES (2, '2023-03-03 12:00:02');
INSERT INTO `tb_order` (`order_id`, `create_time`) VALUES (3, '2023-03-03 12:00:03');
INSERT INTO `tb_order` (`order_id`, `create_time`) VALUES (4, '2023-03-03 12:00:04');
INSERT INTO `tb_order` (`order_id`, `create_time`) VALUES (5, '2023-03-03 12:00:05');

假设我们每次只查询 2 条数据,并且按照时间倒序来查询,结果如下:

-- 发起第一页查询
select * from tb_order order by create_time desc limit 0,2;
-- 第一页查询结果
|order_id |   create_time       |
|5        |  2023-03-03 12:00:05|
|4        |  2023-03-03 12:00:04|

-- 发起第二页查询
select * from tb_order order by create_time desc limit 2,2;
-- 第二页查询结果
|order_id |   create_time       |
|3        |  2023-03-03 12:00:03|
|2        |  2023-03-03 12:00:02|

当订单数据没有发生变动的时候,这种查询方式是不会造成出现重复的数据问题。

但是当订单数据发生了变动,比如在查询的时候,突然新增了订单数据,此时的查询结果就完全不一样了

还是以上面为例,假设在第一次查询的时候,突然新增了一条数据,看看结果如何。

-- 发起第一页查询
select * from tb_order order by create_time desc limit 0,2;
-- 第一页查询结果
|order_id |   create_time       |
|5        |  2023-03-03 12:00:05|
|4        |  2023-03-03 12:00:04|

-- 新增一条订单数据
INSERT INTO `tb_order` (`order_id`, `create_time`) VALUES (6, '2023-03-03 12:00:06');

-- 发起第二页查询
select * from tb_order order by create_time desc limit 2,2;
-- 第二页查询结果
|order_id |   create_time       |
|4        |  2023-03-03 12:00:04|
|3        |  2023-03-03 12:00:03|

可以很明显的发现,订单ID=4的数据,出现在页面上两次,正常情况下只有一次

上面说到的是新增一条数据,假设删除某条数据,看看结果如何。

-- 发起第一页查询
select * from tb_order order by create_time desc limit 0,2;
-- 第一页查询结果
|order_id |   create_time       |
|5        |  2023-03-03 12:00:05|
|4        |  2023-03-03 12:00:04|

-- 删除一条订单数据
delete from tb_order where order_id = 4;

-- 发起第二页查询
select * from tb_order order by create_time desc limit 2,2;
-- 第二页查询结果
|order_id |   create_time       |
|2        |  2023-03-03 12:00:02|
|1        |  2023-03-03 12:00:01|

可以很明显的发现,删除订单ID=4的数据之后,页面查询结果直接到订单ID=2了,直接跳过订单ID=3了,也就是说订单ID=3的数据展示,丢失了

总结下来,结论如下!

  • 当新增某条数据之后,通过常规的分页查询,列表会出现数据重复的现象
  • 当删除某条数据之后,通过常规的分页查询,列表会出现数据丢失的现象

那怎么解决以上的问题呢?办法如下!

三、解决方案

针对上面所说的分页查询方式,我们需要做一些调整,调整办法如下:

  • 第一步:当查询出当页的数据之后,记录下本次拉取的最后一条数据的排序字段值;当发起下一页数据查询的时候,带上这个参数,服务端通过这个参数做过滤条件
  • 第二步:排序字段值不能出现重复

以上面的新增为例,详细的实践过程如下:

-- 发起第一页查询
select * from tb_order order by create_time desc limit 0,2;
-- 第一页查询结果
|order_id |   create_time       |
|5        |  2023-03-03 12:00:05|
|4        |  2023-03-03 12:00:04|

-- 新增一条订单数据
INSERT INTO `tb_order` (`order_id`, `create_time`) VALUES (6, '2023-03-03 12:00:06');

-- 发起第二页查询,带上第一页查询的最后一条数据的排序字段值
select * from tb_order where create_time < '2023-03-03 12:00:04' order by create_time desc limit 0,2;
-- 第二页查询结果
|order_id |   create_time       |
|3        |  2023-03-03 12:00:03|
|2        |  2023-03-03 12:00:02|

此时的查询结果正常,符合预期效果

同样的,以上面的删除为例,详细的实践过程如下:

-- 发起第一页查询
select * from tb_order order by create_time desc limit 0,2;
-- 第一页查询结果
|order_id |   create_time       |
|5        |  2023-03-03 12:00:05|
|4        |  2023-03-03 12:00:04|

-- 删除一条订单数据
delete from tb_order where order_id = 4;

-- 发起第二页查询
select * from tb_order where create_time < '2023-03-03 12:00:04' order by create_time desc limit 0,2;
-- 第二页查询结果
|order_id |   create_time       |
|3        |  2023-03-03 12:00:03|
|2        |  2023-03-03 12:00:02|

查询结果与预期一致,正常!

四、深入思考

  • 选择的排序字段值出现了重复,怎么办

在上面我们提到了,排序字段值不能出现重复的要求,但是现实的情况是,如果以订单的创建时间来排序,当同一秒多次下单的时候大概率会出现重复,这个时候只能在订单表里面新增一个排序字段,设置全局唯一索引,内容是以时间为基础来生成,比如雪花算法,或者自己写一个基于时间全局自增的算法,确保全局唯一,最重要的是值的长度必须固定,订单主键 ID 的生成规则推荐采用此方式,利用主键 ID 来排序效率查询会非常高!

  • 当出现多个排序字段时,如何处理

如果是 app 端的查询,不建议设计多字段排序,因为在多字段排序的环境下,服务端在进行多条件的过滤查询时,可能会把有效的数据给过滤掉,如果无法避开,尽量将多个排序字段合并到一个排序字段上,保证数据的查询符合预期。

五、小结

本文主要围绕 app 端分页查询出现数据重复或丢失的问题,进行一次复盘总结,如果有描述不对的地方,欢迎网友留言指出!

来源:https://mp.weixin.qq.com/s/WGJkCDZSkhN9enDzqrgq6w

 

 

 

标签:03,00,分页,create,查询,丢失,time,order
From: https://www.cnblogs.com/konglxblog/p/17245879.html

相关文章

  • oracle 条件查询失败
    Preparing:SELECTaccuse_id,receive_channel,industry_category,delegate_flag,transfer_department,accuse_content,accuser_type,accuser_id_no,accuser_name,accuser_......
  • solr q查询容错性
    当solr接收没q参数(或q参数值为空)请求时,会报错。对开发调试时才比较有用,但实际运行环境报错就不太好了,java异常可能有点性能消耗,那干脆就返回正常的结果好了(只是结果里没有找......
  • 模糊查询下(like)如何使用覆盖索引优化
    在MySQL中,like‘string%’可以用到索引,但是like‘%string%’却会全表扫描。这个是常识,但真的就没有解决方法了吗?有的,要使用到索引覆盖。什么叫覆盖索引?解释一:就是select......
  • 地铁查询系统安卓端团队进度(一)
    1.今天我和团队成员构思了一下安卓端地铁查询系统应该怎么做,探讨了要实现什么样的功能,并进行了设计.2.并且还需要设计一些按钮,并做到一些美化界面的设计3.并且还商量......
  • 基本分页存储管理的概念
    基本分页存储管理的概念1、什么是分页存储2、重要的数据结构页表问题一:每个页表项占多少字节?问题二:如何实现地址的转换?1)如何确定一个逻辑地址对应的页号、......
  • 全网最详细中英文ChatGPT-GPT-4示例文档-官网推荐的48种最佳应用场景——从0到1快速入
    目录Introduce简介setting设置Prompt提示Sampleresponse回复样本APIrequest接口请求python接口请求示例node.js接口请求示例curl命令示例json格式示例其它资料下载......
  • Json Long 类型精度丢失
    1.现象在SpringBoot项目中,使用Jackson将Java对象转为Json传给前端,但Java对象有Long类型字段,传给前端后会出现精度丢失的现象。比如发送的Json字符串如下所......
  • 大数据量实时统计排序分页查询(并发数较小时)
    大数据量实时统计排序分页查询的瓶颈不是函数(count,sum等)执行,不是having,也不是orderby,甚至不是表join,导致慢的原因就在于“数据量太大本身” 化整为零就是将表划分为M......
  • java 微信支付v3 —6.微信支付查询订单API
    正文什么时候会用到这个API?常规情况下,回调接口已经足够我们使用,用户支付成功后,微信会自动调用我们的回调接口进行回调,那么还需要这个API吗?使用场景:微信服务器故障,我们的服......
  • Sql Server中查询数据库所有表及其数据总条数和占用空间
    1、查询某数据库中的所有数据表SELECTname数据表FROMsysobjectsWHERExtype='u'ORDERBYname2、查询某数据库中的所有数据表及其数据总条数SELECTa.name数据表,......