首页 > 其他分享 >性能瓶颈TOP榜,你中招了吗?

性能瓶颈TOP榜,你中招了吗?

时间:2024-09-22 11:49:52浏览次数:1  
标签:事务 瓶颈 TOP 回滚 主键 索引 死锁 数据库 中招

专业在线打字练习网站-巧手打字通,只输出有价值的知识。

前言

系统性能如同企业的生命线,一丝瓶颈都可能引发连锁反应。本次“巧手打字通课堂”将带您深入剖析那些隐藏在背后的性能杀手,让我们一起来揭开它们的神秘面纱。

一 并行处理的那些难题

1. 锁粒度,要细化

你能看出下面代码中存在的问题吗?

public final class CachedAround implements Around {
    private final transient ConcurrentMap<Object, Tunnel> tunnels = new ConcurrentHashMap<>(0);

    public Object doAround(ProceedingJoinPoint point) throws Throwable {
        final Object key = generateKey(point);
        // 优先读取缓存结果数据
        Object obj = readCache(key);
        if (obj != null) {
            return fromStoreValue(obj);
        }
        Tunnel tunnel;
        synchronized (this.tunnels) {
            tunnel = this.tunnels.get(key);
            if (tunnel == null) {
                tunnel = new Tunnel(point);
                this.tunnels.put(key, tunnel);
            }
        }
        // 执行业务处理逻辑
        obj = tunnel.proceed();
        // 将处理结果进行写入缓存
        writeCache(point, key, obj);
        return obj;
    }

    /**
     * 业务逻辑执行
     */
    private static final class Tunnel implements Serializable {
        private final transient ProceedingJoinPoint point;
        private volatile boolean executed;
        private Object value;

        Tunnel(final ProceedingJoinPoint pnt) {
            this.point = pnt;
        }

        public synchronized Object proceed() throws Throwable {
            if (!this.executed) {
                value = point.proceed();
                this.executed = true;
            }
            return value;
        }
    }
}

上述代码旨在首先尝试从缓存中检索服务的结果,以优化性能。若缓存中不存在有效数据(即缓存失效),则按照常规流程处理请求,并将新生成的结果存入缓存中,确保后续请求能够直接利用缓存中的数据,从而减少重复处理并提高响应效率。

该代码在低访问量时运行尚算平稳,但面对高并发时,性能瓶颈显著。

关键在于synchronized (this.tunnels)导致的单点锁争用,尤其在缓存穿透情况下,造成严重的线性阻塞。

为解决此问题,需引入更细粒度的锁机制,如基于请求类型或业务key的锁,以避免全局单一锁点的限制。

2. 请求叠加翻倍,需谨防

在通过RPC获取某些数据时,切记不要在实现层面将请求次数叠加扩散。

public static void main(String[] args) {
    int requestNum=100;
    List<Person> personList = new ArrayList<>();
    // 一个请求,扩散成上百的RPC调用请求
    for (int i = 0; i < requestNum; i++) {
        // 从数据库一条一条的查询
        Person person1 = findPersonFromDataBase(i);
        // 从另一个服务一条一条的获取
        Person person2 = findPersonFromRemoteService(i);
        // 从缓存中一条一条的获取
        Person person3 = getPersonFromRedis(i);
    }
    Person person = Person.of("John");
}

上述案例在请求量较小时不易察觉风险,但随请求量激增,问题便凸显出来。为有效预防此类情况,可通过调用批量处理接口来优化处理流程,从而降低风险。

3. @Transaction,有局限

@Transactional 注解是管理数据事务的强大工具,支持包括事务控制、读写分离在内的多种功能,它既可以应用于类级别,也能作用于方法级别,极大地方便了开发过程。

然而,在使用时需注意以下几点潜在“陷阱”,以确保事务管理的正确性和效率:

  • 动态代理限制:由于@Transactional通过动态代理实现,因此被注解的方法必须是public的,否则事务管理将不会生效。这是因为动态代理仅能对外部可访问的方法进行拦截和处理。
  • 异常回滚策略:默认情况下,仅当遇到RuntimeException(运行时异常)时,事务才会自动回滚。若希望所有类型的异常(包括Exception及其子类)都能触发回滚,需明确指定@Transactional(rollbackFor=Exception.class)。
  • 内部方法调用失效:若一个未加@Transactional注解的方法(如A方法)在同一类中调用了另一个带有@Transactional注解的方法(如B方法),则B方法的事务注解将不会生效。这是因为内部调用不会通过代理对象进行,从而绕过了Spring的事务管理机制。
  • 异常捕获与事务回滚:若事务方法内部捕获了异常且未重新抛出,则Spring无法感知到异常的发生,因此不会触发事务回滚。确保在需要事务回滚的场景中,不要无差别地捕获所有异常或至少应重新抛出需要回滚的异常。
  • 非事务性操作影响:在事务方法中执行非事务性操作,如远程过程调用(RPC)或复杂的数据库查询,可能会显著影响事务的效率和数据库的吞吐量。这些操作可能因网络延迟、外部系统响应等因素而延长事务的持续时间,进而影响到整个应用的性能。举例:
@Transactional(rollbackFor = Exception.class)
public Boolean cancelOrder(String orderNo) {
    // 1.查询订单状态
    OrderInfo orderInfo = dbMapper.get(orderNo);
    // 2.订单状态幂等设计
    if (orderInfo.getStatus == OrderStatusEnum.CANCEL) {
        return true;
    }
    // 3.订单退费,促销回滚等
    if (orderInfo.getStatus >= OrderStatusEnum.PAY) {
        payService.rollback(orderNo);
    }
    // 4.更新数据库订单状态
    int r = dbMapper.update(orderNo, OrderStatusEnum.CANCEL);
    return r > 0;
}

在给出的示例代码中,订单状态更新的数据库事务中不恰当地包含了订单查询和支付回滚等非数据库事务性操作。这种做法延长了数据库会话的持续时间,将原本应简洁的小事务扩展成了复杂的大事务。在高并发环境下,这种设计会显著增加数据库的负载,导致吞吐量显著下降。为了优化性能,建议将除了直接更新订单状态的数据库操作(即第4步)之外的所有其他逻辑,如查询和支付回滚处理,都移至数据库事务处理流程之外进行。

总之,在设计事务时,应尽量避免在事务中执行过多或复杂的非事务性操作。

4. 数据库死锁,要关注

数据库死锁是指两个或多个事务在执行过程中,因相互竞争资源而陷入一种彼此等待对方释放资源的僵局状态,若无外部干预,这些事务将无法继续推进。

现代数据库系统普遍内置了死锁检测和解决机制,它们能够自动识别并处理这类情况,常见的解决策略包括强制终止其中一个或多个事务并回滚其操作,以打破死锁循环。但这无疑还是会对系统的性能吞吐量和业务支撑能力都产生不利影响。
死锁典型场景:
img
在并发执行的环境中,每个事务分别执行两条SQL语句,每条语句执行时都获取了不同的锁。随后,这些事务尝试获取对方已持有的锁,由于它们加锁的顺序不一致,导致彼此都在等待对方释放资源,从而形成了一个锁等待的环路,最终造成了死锁现象。简而言之,就是两个或更多会话(Session)因加锁顺序不一致而相互阻塞,形成了死锁。

在单表操作中,同样也有可能造成死锁:
img
如果name和pubtime这两个字段分别建立了索引,并且当两个事务分别通过name索引和pubtime索引访问数据时,它们可能会尝试对各自访问到的数据行在对应的聚簇索引上加上排他锁(X锁)。由于这两个事务加锁的顺序可能不一致,且每个事务都在等待对方释放其已持有的锁,这种情况下就有可能发生死锁。

鉴于死锁难以完全避免,我们应当采取一系列策略来尽量减少其发生的风险。以下是五条实用的建议:

  • 保持一致的访问顺序:在处理多个表或行时,确保所有事务以固定的顺序访问这些资源。例如,在批量更新作业的场景下,可以先对涉及的ID列表进行排序,然后依次执行更新操作,这样可以有效避免交叉等待锁的情况。同样地,调整不同事务中的SQL执行顺序,使其保持一致,也是预防死锁的有效手段。
  • 拆分大事务:大事务更容易导致死锁,因为它们需要长时间占用大量资源。如果业务逻辑允许,应尽量将大事务拆分成多个小事务来执行,这样可以减少锁资源的占用时间,降低死锁的风险。
  • 批量锁定资源:在同一个事务中,应尽可能一次性锁定所有需要的资源,而不是分步进行。这样可以减少因资源请求顺序不一致而导致的死锁情况。
  • 调整隔离级别:如果业务场景允许,适当降低事务的隔离级别也是一个减少死锁的有效方法。比如,将隔离级别从可重复读(RR)调整为读已提交(RC),可以避免一些因间隙锁(gap lock)引起的死锁问题。
  • 优化索引设计:合理的索引可以确保数据库查询和更新操作高效执行,减少对非目标行的锁定。尽量规避数据库扫描全表,并对每一行数据加锁,这将大大增加死锁的风险。因此,为表添加合适的索引是预防死锁的重要措施之一。

二 数据量大的那些难题

1.深分页,有妙招

大部分存储中间件都会存在深分页问题,以数据库为例,假设订单表里已经存了8000万条数据,我们想遍历整个订单表,对今年生产的订单进行归档。如何快速的低成本的实现这个功能呢?

起初,可以使用下面语句进行分页查询:

SELECT * FROM my_order WHERE create_time > '2023-01-01 00:00:00' LIMIT 100000, 20;

随着页面的加深,这条sql语句的执行时间将会越来越长。其原因是在使用普通索引查询时,要想获取其它列数据,mysql需要回表,因为普通索引上存储的是主键,通过主键获取行数据。

在查询0~20条的数据时,需要回表20次,查询100000~100020的数据需要回表100020次,性能就会变得极差。

那么该如何减少回表次数呢?

  • 方案一

首先,利用普通索引快速定位到第100001条数据的ID(假定ID是递增的,且普通索引即建立在ID上),由于该索引直接存储了主键ID,因此此过程无需进行回表操作。

随后,基于获取到的这个主键ID,通过主键索引直接访问并检索紧接着的10条数据记录,因为主键索引的节点中直接包含了行数据,所以可以直接提取这些数据,从而提高了查询效率。

SELECT * FROM my_order WHERE id > (SELECT a.id FROM my_order a WHERE a.create_time > '2023-01-01 00:00:00' LIMIT 100000, 1) LIMIT 10; 
  • 方案二

如果表采用了数据库的自增主键,那么可以通过将当前页最后一条记录的主键ID作为查询下一页数据的起始ID参数,来高效地实现目标数据的快速定位。

这种方法利用了主键的自增特性,简化了查询过程,提高了数据检索的效率。

SELECT * FROM my_order WHERE id > lastReturnID LIMIT 10; 

2. 序列化,能耗高

在日常开发过程中,下面几个操作会显著增加了系统资源的消耗,导致服务整体性能不稳定,需要认真考虑并采取相应措施来化解:

  • 频繁使用Java反射操作处理大对象,尤其是在对象拷贝等场景中,这会显著增加CPU负担和内存使用。
  • 数据对象频繁地进行JSON序列化与反序列化转换,如日志记录、DTO(数据传输对象)之间的转换等,这些操作同样会消耗大量CPU资源并影响系统响应速度。
  • 日志打印过于频繁,尤其是在对请求入参和出参进行无差别记录时,不仅增加了磁盘I/O负担,还可能泄露敏感信息,影响系统安全性。
  • 内存中持续存储大量的大对象,如文件和图片上传下载功能中暂存的数据,这些大对象会占用大量内存资源,影响系统的稳定性和扩展性。

三 总结

本文主要剖析了并行处理与大数据处理领域内影响系统性能的几个难题。

  • 在并行处理架构中,不恰当的锁粒度设计往往引发资源激烈争用,加之请求叠加效应,导致系统负载成倍增加,显著加剧了系统压力。此外,@Transaction注解的局限性束缚了事务管理的灵活应变能力,而数据库死锁则作为并发控制领域的难题,阻碍着系统的高效运行。

  • 大数据处理领域,深度分页查询的性能瓶颈日益显著,成为制约数据处理效率的关键因素。同时,在数据序列化过程中,潜在的资源消耗陷阱不容忽视,需采取有效措施以规避资源浪费,防止其成为系统性能提升的瓶颈。

最后,希望本文对读者有所启发和帮助。

标签:事务,瓶颈,TOP,回滚,主键,索引,死锁,数据库,中招
From: https://www.cnblogs.com/qiaoshoutong/p/18425100

相关文章

  • 【Ambari自定义组件集成】Bigtop编译大数据组件,看这一篇就够了
    快捷导航在正式内容之前,通过下方导航,大家可以快速找到相关资源:快捷导航链接地址备注相关文档-ambari+bigtop自定义组件集成https://blog.csdn.net/TTBIGDATA/article/details/142150086CSDN地址编译、开发、部署、集成解决方案https://t.zsxq.com/0PVcI知识星球源代码-Ambar......
  • Thinkphp8安装topthink/think-captcha验证码的和使用方法
    ThinkPHP8默认没有验证码,安装验证码可以使用composer来安装验证码一、安装验证码执行composer安装验证码composerrequiretopthink/think-captcha二、使用方法1、在目录app\middleware.php中开启session\think\middleware\SessionInit::class2、配置验证码安装好验证......
  • 【python爬虫案例】利用python爬取豆瓣读书评分TOP250排行数据
    一、爬取案例-豆瓣读书TOP250上一期给大家分享了个python爬虫案例:豆瓣电影TOP250的排行榜数据爬取【python爬虫案例】利用python爬虫爬取豆瓣电影评分TOP250排行数据!今天再给大家分享一下:豆瓣读书排行榜TOP250的python爬虫案例!因为是同一个网站,所以流程和逻辑上都是差不多的。......
  • 【算法】topk之字节题
    1.合并两个有序列表......
  • xtop:multi_driven_net与incomplete_timing_cell fail reason 分析
    我正在「拾陆楼」和朋友们讨论有趣的话题,你⼀起来吧?拾陆楼知识星球入口xtop做时序收敛时报告failreason&#x......
  • 基于RK3588,AI边缘模块,单片6TOPS,可集群堆叠,Mixtile Blade 3
    MixtileBlade3 是一款经济实惠、节能的SBC,围绕下一代8纳米瑞芯微RK3588处理器构建。它非常适合快速开发、AI应用程序原型设计和边缘计算,允许您集群多个MixtileBlade3SBC以扩展您的部署。硬件布局正反面开箱即用的MixtileBlade3是一款可堆叠计算机,带有板载......
  • centos 7 for Mac m3 parallel desktop 安装
    镜像下载地址https://www.alipan.com/t/1VYeNVvBvDLBeuW24r6i失效请追加评论,安装过程省略问题关闭selinux无法启动1、启动进入单用户模式启动后按e进入在最后加入selinux=0ctrl+x启动,完成。2、修改grub文件:vi/etc/grub2-efi.cfg在第100行末尾加入selinux=0100......
  • 阅信云CTO向永清:35岁不应该成为技术职业发展的瓶颈|OceanBase 《DB大咖说》
    本期嘉宾:向永清,2010年进入中国空间技术研究院总体部工作。他从DBA起步,不断成长,后来出来创业,现为阅信云CTO,负责阅信云产品研发和团队管理工作,成为公司的技术领军人物及数字化转型领域的专家。在向永清先生的职业生涯中,始终怀揣着对技术的好奇与热情,他所展现的技术情怀与使命感,为......
  • Python用TOPSIS熵权法重构粮食系统及期刊指标权重多属性决策MCDM研究|附数据代码
    原文链接:https://tecdat.cn/?p=37724原文出处:拓端数据部落公众号 分析师:SikunChen在当今世界,粮食系统的稳定性至关重要。尽管现有的全球粮食系统在生产和分配方面表现出较高的效率,但仍存在大量人口遭受饥饿以及诸多粮食安全隐患。与此同时,在学术领域,准确评估情报学期刊的质......
  • 10. Top-K vs Top-P:生成式模型中的采样策略与 Temperature 的影响
    在之前的文章中我们探讨了BeamSearch和GreedySearch。现在来聊聊model.generate()中常见的三个参数:top-k,top-p和temperature。代码文件下载文章目录Top-K采样详解工作原理数学表述代码示例Top-P采样详解工作原理数学表述代码示例Temperature的作......