如何对线上的 nodejs 做监控,了解相关的 GC、内存使用情况、性能,如何更好的了解相关的指标,我们需要做一个采集线上数据的方案,但是又不希望侵入性太强 ,首先收集的指标。
内存相关指标说明
堆内存
- rss:常驻内存,node 进程分配的总内存大小
- external:v8 管理的 C++所占用的内存大小
- arrayBuffers:分配给 ArrayBuffer 的内存大小
- heapTotal:v8 申请的堆内存大小
- heapUsed:v8 已使用的堆内存大小
堆内存详情
- ready_only_space:只读空间
- old_space:老生代空间,用来存放 New Space 晋升的对象
- code_space: 存放 v8 JIT 编译后的可执行代码
- map_space::存放 Object 指向的隐藏类的指针对象,隐藏类指针是 v8 根据运行时记录下的对象布局结构,用于快速访问对象成员
- large_object_space:用于存放大于 1MB 而无法分配到页的对象
- code_large_object_space:代码大对象空间
- new_large_object_space:新生代大对象空间
- new_space:新生代空间,用来存放一些生命周期比较短的对象数据
其他
- number_of_native_contextsnative_context 的值是当前活动的顶级上下文的数量。该数字随着时间的推移而增加表明存在内存泄漏。
- number_of_detached_contextsdetached_context 的值是已分离但尚未进行垃圾收集的上下文的数量。该数字非零表示存在潜在的内存泄漏。
- heap_size_limit: 就是老生代可以使用的最大内存
GC 监控
- gc_ts: 1700642047578587,GC 发生的时间,精度可能需要提高到 ms 级别,而不是 second 级别
- gcScavengeCount: 23, 清除数量, V8 新生代内存中垃圾回收使用 Scavenge 算法。
- gcScavengeTime: 33933875, 清除耗时 ns,1ns = 十亿分之一秒,1 纳秒(ns)等于 0.000001 毫秒(ms)
- gcMarkSweepCompactCount: 3,gc 标记扫描压缩计数
- gcMarkSweepCompactTime: 19564916, gc 标记扫描压缩时间
- gcIncrementalMarkingCount: 6, gc 增量标记计数
- gcIncrementalMarkingTime: 2438334, gc 增量标记时间
- gcProcessWeakCallbacksCount: 3, gc 进程弱回调计数
- gcProcessWeakCallbacksTime: 24542, gc 进程弱回调时间
- gc_time: 3474250 gc 时间
性能快照v8 Profile 使用
1、访问 router
,生成 main.cpuprofile
文件
2、wget ${STATIC_PATH}/main.cpuprofile
获取线上 .cpuprofile
文件,然后基于 vscode 进行性能分析,Flame Chart Visualizer for JavaScript Profiles
,下载 vscode 插件可以直接生成火焰图
注意 :请确保 baseRouter
在 nginx
配置指向当前的服务
示例
内存快照 heapSnapshot 使用
1、访问 router
,生成 heapSnapshot
文件
2、wget ${STATIC_PATH}/main.heapSnapshot
获取线上 .heapSnapshot
文件,然后使用 Chrome Memory
功能,加载生成的文件
注意 :
1、请确保 baseRouter
在 nginx
配置指向当前的服务
2、等到服务人少的时候进行收集文件,因为生成 heapSnapshot
可能比较耗时,文件可能会比较大,超出系统存储上线(特别是本身申请的内存就比较小的服务,可能需要手动清理生成的 heapSnapshot
文件)
npm 包:@pvjs/nodejs-monitor
更多详情 GitHub - yiyi17/nodejs-monitor: nodejs-monitor 监控
材料参考
Nodejs 调试指南
Node.js 中扩展内存那些事
v8.getHeapStatistics()
nodejs 内存监控 1-监控方案
一文了解 Node.js 性能监控
NodeJs 中内存机制
《深入浅出 Node.js》-内存控制
node-v8 堆内存分析
heap_size_limit 默认是总系统内存的一半 一个 node 诊断的仓库
v8-profiler-node8 生成 json 后,使用 speedscope 加载解析生成火焰图
alinode 性能监控