首页 > 编程语言 >C++性能分析工具gperftools

C++性能分析工具gperftools

时间:2022-12-29 09:44:26浏览次数:67  
标签:-- 性能 函数调用 C++ prof test gperftools CPU

最近编写的程序遇到了性能瓶颈,CPU吃满的情况下消费能力上不去,导致消息积压迟迟得不到消费,最终被kafka丢弃
于是开始对程序进行调优,提高消费能力,便找到这个工具,找到程序中使用CPU时间较多的操作,并对这些操作进行调整,反复测试和调整,不断迭代得到高性能的程序

这里只使用了gperftools里的cpuprofiler,谷歌这套工具里面也有堆栈的分析工具,那些下次有用到在做分享吧

编译安装

到github/gperftools上获取源码

wget https://github.com/gperftools/gperftools/archive/gperftools-2.7.tar.gz
tar xvf gperftools-2.7.tar.gz
cd gperftools-2.7
./configure
make -j8
sudo make install

如果是64位系统需要依赖到libunwind

cd libunwind-1.3.1
./configure
make && sudo make install

使用CPUprofiler

官方说明

在编译的时候连接profiler

gcc [...] -0 proc -lprofiler

使用cmake的情况

target_link_libraries (
    ...
    "profiler"
)

主动结束的程序

在代码中引入gperftools/profiler.h,使用ProfilerStart()和ProfilerStop()函数

#include <gperftools/profiler.h>
int main(int argc, const char* argv[]) {
    ProfilerStart("test.prof");
    ...;
    ProfilerStop();
}

在执行ProfilerStop()的时候就生成测试报告test.prof了

持续运行的程序

对于持续运行的程序,例如服务器程序和反复的消费程序,内部是死循环无法主动退出的情况下,可以通过设置开关来控制程序生成测试报告

#include <gperftools/profiler.h>
#include <signal.h>
#include <iostream>
void setGperfStatus(int signum) {
    static bool is_open = false;
    if (signum != SIGUSR1) {
        return ;
    }
    if (!is_open) {  // start
        is_open = true;
        ProfilerStart("test.prof");
        std::cout << "ProfilerStart success" << std::endl;
    } else {  // stop
        is_open = false;
        ProfilerStop();
        std::cout << "ProfilrerStop success" << std::endl;
    }
}
int main(int argc, const char* argv[]) {
    signal(SIGUSR1, setGperfStatus);
    ...;
}

在程序运行后,通过kill指令发送信号控制开启关闭性能分析模块

kill -s SIGUSR1 $PID

开启性能测试后运行一段时间,等待采集到的足够多的样例之后,再次发送信号关闭性能分析,生成测试报告

测试报告

性能分析通过抽样方法完成,默认是1秒100个样本,一个样本是10毫秒,即时间单位是10毫秒
可以通过环境变量CPUPROFILE_FREQUENCY设置采样频率

使用gperftools提供的pprof工具转换.prof文件为可阅读的形式,支持多种形式

文本形式

pprof proc test.prof --text > test.txt
信息

每行包含6列数据,依次为:

  1. 分析样本数量(不包含其他函数调用)
  2. 分析样本百分比(不包含其他函数调用)
  3. 目前为止的分析样本百分比(不包含其他函数调用)
  4. 分析样本数量(包含其他函数调用)
  5. 分析样本百分比(包含其他函数调用)
  6. 函数名

样本数量相当于消耗的CPU时间
整个函数消耗的CPU时间相当于包括函数内部其他函数调用所消耗的CPU时间

树形图

pprof proc test.prof --web > test.html
pprof proc test.prof --pdf > test.pdf
节点

每个节点列出的信息:

  1. 函数名 或者 类名+函数名
  2. 不包含内部函数调用的样本数(百分比)
  3. 包含内部函数调用的样本数(百分比),如果没有内部调用函数则这一项数据不显示
有向边

调用者指向被调用者,有向边上的时间表示被调用者所消耗的CPU时间

过滤

可以通过设置focus或者ignore来集中显示、过滤某个函数

pprof proc test.prof --gv --focus=vsnprintf  # 只关注某个函数
pprof proc test.prof --gv --ignore=snprintf  # 过滤掉某个函数


转☞ https://www.jianshu.com/p/bf2f8a5a81d0

标签:--,性能,函数调用,C++,prof,test,gperftools,CPU
From: https://www.cnblogs.com/Maker-Liu/p/17011756.html

相关文章

  • 浅谈系统性能提升的经验和方法
      一、背景资金核对的数据组装-执行-应急链路,有着千万级TPS并发量,同时由于资金业务特性,对系统可用性和准确性要求非常高;日常开发过程中会遇到各种各样的高可用问题,也......
  • 浅谈系统性能提升的经验和方法
      一、背景资金核对的数据组装-执行-应急链路,有着千万级TPS并发量,同时由于资金业务特性,对系统可用性和准确性要求非常高;日常开发过程中会遇到各种各样的高可用问题,也......
  • 浅谈系统性能提升的经验和方法
      一、背景资金核对的数据组装-执行-应急链路,有着千万级TPS并发量,同时由于资金业务特性,对系统可用性和准确性要求非常高;日常开发过程中会遇到各种各样的高可用问题,也......
  • 浅谈系统性能提升的经验和方法
      一、背景资金核对的数据组装-执行-应急链路,有着千万级TPS并发量,同时由于资金业务特性,对系统可用性和准确性要求非常高;日常开发过程中会遇到各种各样的高可用问题,也......
  • 【《硬件架构的艺术》读书笔记】09 电磁兼容性能设计指南(3)
    9.6.3微控制器级技术解决噪声问题的最佳途径在源头。9.6.3.1多时钟和接地去耦电容:1、容量应足够大以在转换时间内提供所需的电流。2、应足够小以使时钟频率小于电容......
  • LeetCode_Heap_剑指 Offer 40. 最小的k个数 【堆,泛型实现,自定义比较器】【C++/java】
    目录​​一,题目描述​​​​英文描述​​​​中文描述​​​​示例与说明​​​​二,解题思路​​​​1,手动实现堆——C++泛型实现​​​​2,手动实现堆——java泛型实现​​......
  • VC++6.0显示代码行号
    转载自:https://blog.csdn.net/myblog_dwh/article/details/22582741VC6.0是一款比较稳定的功能强大的IDE,目前也有很多人在使用。但美中不足的是它不能像其他IDE那样显示......
  • 关于iview中Slider组件@on-input和@on-change事件重复触发引发的渲染性能问题
    <template><divstyle="width:200px"><Slidershow-inputinputSize="small"v-model="value"@on-input="input"@on-change="change"></Slider>......
  • C/C++程序设计综合实践指导[2021级]
    C/C++程序设计综合实践指导[2021级]2021级程序设计综合实践指导一、综合实践要求综合实践是C语言程序设计、C++到数据结构三门课程的一个综合实践练习,是有别于课程实验......
  • 有序存储对于高性能的意义
    摘要:有序存储是指将数据按照某些字段排序后再存储。在此基础上,我们可以实现某些高性能算法,利用数据有序的特征来降低计算复杂度,从而大幅提高计算性能。本文分享自华为云社区......