从uptime命令开始;这里的关键指标是平均负载,它显示了过去
1分钟,5分钟和15分钟内正在运行或等待资源的进程平均数量;如果这些数字持续高于CPU内核数,则可能表明进程正在争夺资源,提示我们使用其他工具深入研究
1.使用top工具;top提供了系统流程和关键指标的动态,持续更新的视图;它就像系统性能的仪表盘;
需要关注的关键指标是用户进程和系统进程占用CPU的百分比;top还会显示正在运行的进程列表,密切关注CPU或内存消耗比列异常搞得进程(top提供的是当前时刻的快照,要想了解更全面的情况,需要长期观察。)
2.vmstat命令可以同时显示多个系统组件,并实时更新,需要关注的关键领域包括CPU部分的CPU队列,IO等待,交换活动和io等待时间
3.要深入了解磁盘IO,我们可以使用iostat;他可以让我们连续查看磁盘活动,需要关注的关键指标是磁盘活动的每秒事务数和CPU部分IO操作等待时间的百分比
iostat按设备细分IO操作,当需要确定哪个磁盘导致性能问题时,很有用
4.netstat,监控网络连接工具
列出说有活动连接,包括传入和传出连接,它有助于识别系统上的开放端口和活动服务
还可以计算特定端口的连接数 netstat -an | grep -c ':80' 它可以快速衡量特定服务的负载,如果我们看到异常高的连接
数,可能表明存在潜在的性能问题或需要调查的流量高峰
5.sar系统活动报告程序,它可以保存历史数据
符:
Tools |
top |
vmstat |
iostat |
netstat |