性能基础体系

标签：体系 RT 场景性能基础业务测试模型

知识体系

基础指标

简单来说，性能测试实际上主要关注如下三点：

速度：TPS、RT ；
容量：吞吐量、PV、Hit；
资源：CPU、Memory、DiskIO、Network、文件句柄数；

性能分层

性能测试领域，要在评估调研阶段就考虑性能分层的影响。在性能分析和优化阶段，也要考虑不同层级对整体性能的影响。我将它们分为如下六层：

网络层：主要指带宽、网段、防火墙等设施，当然，CND之类的资源，也可以划分在这一领域；
网关层：网关是请求入口和业务接入层，一般登录验签调用、加解密鉴权、限流等操作，都是在网关进行；
应用层：无论是前端的渲染展示还是后端的逻辑处理，都可以理解为应用层；
中间件：中间件包含缓存、MQ、JOB、DTS/DRC/DAL、配置中心等一系列组件；
存储层：一般指数据存储和文件存储层级，典型的组件有MySQL、HDFS；
物理层：无论是云服务还是自建机房，物理硬件层面都可以归纳到这一层；

需求调研

项目背景：版本迭代&独立项目&新建服务&系统重构&性能优化；
测试目的：超卖&高并发&扩容性&配置验证&资源耗用；

系统架构

- 技术架构：服务间的依赖关系，包含缓存，MQ等信息；
- 网络拓扑：请求-域名-SLB/HA/Nginx-web-app-DB以及外部依赖；

场景模型
- 业务场景：业务场景的多样性和特殊性以及对脚本开发联调&数据预埋的影响；
- 业务模型：只读、读写、批处理、定时Job；
- 业务配比：被测场景占总体场景的业务量占比（公式：被测场景/总业务量*100%）
  - 选取业务峰值的数据，单独统计；
  - 如果各业务占比类似，则按照比例转化；
  - 如果比例差距大，则按照区间单独统计分析；
环境配置：PRE&PERF、app&Redis&MQ&DB&网络&网段&&带宽&防火墙，是否独享资源隔离等；

性能指标

- 业务指标：DAU、GMV、注册用户数、在线用户数、活跃用户数、增长趋势等；
- 系统指标：协议类型、长短链接、同步策略、加解密、JVM内存分配、容器线程数&连接数&Timeout、MQ-Cousumer数量；
- 压测指标：QPS、TPS、ART、99%RT、Success%；

数据类型
- 数据铺底量；
- 是否有敏感数据需脱敏；
- 限制条件(时间&次数&权限)；
- 自增、唯一、UUID、加解密、幂等；
关键时间：提测时间、验收时间、上线时间；

模型场景

业务模型：业务场景、流量转化漏斗；
测试模型：关注核心场景，过滤无关及非核心业务；
场景模型：从系统架构设计层面出发，关注不同层面，提升性能！

- 基准：单机单服务单接口；
- 并发：设定阈值，观察水位；
- 容量：阶梯式加压、性能拐点、资源瓶颈；
- 异常：容错处理、监控告警、容灾恢复演练；
- 稳定性：长期稳定正确提供服务的能力，可用性SLA；

测试方案

项目背景：说明项目开展的背景及目的；
测试方案：针对项目涉及的场景，测试实施的大体方案；
实施准则：任何项目，都要有准入准出和暂停中止准则；
性能模型：针对具体的场景，设计的性能模型最好经过评估验证；
测试策略：针对测试模型所采用的不同的测试策略，同步的测试策略要达成什么样的目的；
性能指标：业务指标是多少？转化的技术指标是多少？冗余范围有多大？
准备工作：其中包含环境、数据、脚本、监控等准备事项；
组织结构：整个项目中涉及哪些事项？不同事项的负责人是谁？交付时间是什么时候？

结果评估

在性能测试实施过程中，准确定义和描述性能测试结果，及针对不同结果进行模型分析，是很重要的一项能力。

性能实施方法论

- 基于指标构建；
- 建模是分析的过程和结果；
- 基于真实环境的系统模拟；
- 压测实施过程是整体的核心；
- 需要设定统一的目标、流程、分析方法、组织结构；

正确描述性能结果和过程的术语

- 瓶颈描述：什么场景执行了什么策略/操作，因为什么原因导致了什么结果；
- 解决方案：优化了哪里？验证的方式及结果？是否满足预期&是否解决了发现的问题？

性能分析层级

- 业务分级：业务-场景-数据-架构-参数；
- 技术分级：引擎-网络-应用-中间件-数据库；
  - 工具：关注指标，从结果反推过程；
  - 配置：线程、连接数、Timeout、长短链接、同步异步、路由转发；
  - 应用：日志、硬件配置、资源使用率；
  - 中间件：Job、缓存命中、消息堆积、Consumer配置；
  - 数据库：资源耗用、库表结构、表锁行锁、活跃连接数、最大连接数；

性能拐点

- TPS增长放缓，RT快速上升；

性能交叉点

- 模型上的TPS和RT交叉节点；

性能平衡点

- 重点关注业务可接受的最大RT；

性能衰减点

- timeout参数&TPS急剧恶化抖降&RT快速飙升；

脚本设计

什么时候需要做脚本关联？

- 服务端结果动态返回，非幂等；
- response body的参数需要向下透传；

如何理解并发和事务的区别？

- 并发指的是同一时刻服务端接收到的请求数，而非压测引擎的并发线程/RPS；

thinktime怎么用？

- 它有什么效果？
- 是否存在真实的业务场景？
- 是否影响整体的压测场景和服务资源？

主要关注哪些指标？

- 并发数、TPS、ART、99%RT、CPU%、Memory%、systemLoad%；

典型特例

文件存储优化

- 原理：文件/图片存储在源节点，利用CDN缓存各种变更和路径。CDN未命中，回源节点处理并返回，同时同步最新的变更和路径到CDN。
- 优点：节省存储成本，提高查询展示渲染性能，灵活满足业务。
- 注意事项：大文件分块存储，避免局部过热导致单机磁盘IO过载，分块有助于整体系统资源调度。

秒杀超卖场景

　　适用场景：秒杀、限时抢购、限量抢购等。

- 单用户单端多次抢购；
- 单用户单端限量抢购；
- 单用户多端抢购→低并发；
- 单用户多端抢购→高并发

标签：体系,RT,场景,性能,基础,业务,测试,模型
From： https://www.cnblogs.com/testcodell/p/17073104.html