性能分析之 Linux 系统中 ps&top 中 CPU 百分比不一致?

简介: 【8月更文挑战第18天】性能分析之 Linux 系统中 ps&top 中 CPU 百分比不一致?

一、前言

今天在 7DGroup 的群里,有人提了个问题,ps 统计出来的 CPU 百分比为什么比 top 统计出来的少很多?

二、问题现象

如下图:
image.png

image.png
image.png

从上面的图来加一下,确实差别比较大呀。

top 里面:

$$ 800 -16.9-7.6-22.1-29.9-8.8-24.4-16.9-20.3 = 653.1 $$

而 ps 里面只有 300% 以下。

三、问题分析

什么会这样呢?

先得了解 ps 和 top 有什么区别:

  • Top 是一个 monitoring tool,但 ps 是一个 snapshot tool。这是一个本质的区别。

  • ps 是取当前数据的,从 /proc/pid 目录中取出来。 top 是在一直取数据,并且根据刷新周期做计算的。

  • ps怎么计算CPU的呢?

    • 有几参数如下:
      • 系统启动时间: 是系统自启动以来的总时间长度。
      • 线程启动时间:线程启动的时间点。
      • 线程CPU时间:线程用CPU的时间长度。
      • 线程时间 = 系统启动时间 - 线程启动时间
      • 线程CPU使用率 = 线程CPU时间 * 1000 / 线程时间
      • 计算出的CPU使用率百分比 = 线程CPU使用率 / 10. 线程CPU使用率%10
    • 举例说明:
      • 系统启动时间: 15456374.085712
      • 线程启动时间:9470058.848042
      • 线程CPU时间:987163
      • 线程时间 = 15456374.085712 - 9470058.848042 = 5986315.23767
      • 线程CPU使用率 = 987163 * 1000 / 5986315.23767 = 164.9
      • 计算出的CPU使用率百分比 = 164.9 / 10. 164.9%10 = 16.5
  • ps 计算百分比的数据取自 /proc/ 目录

    • 从/proc/pid/stat 取出如下几个时间:
      • utime:用户模式的CPU时间消耗
      • stime:内核模式的CPU时间消耗
      • cutime:用户模式的CPU时间消耗,包括子进程
      • cstime:内核模式的CPU时间消耗,包括子进程
      • starttime:线程启动时间点
  • 时间消耗是通过 CPU 时间片来统计的。计算的基础就是 CPU 时间片,CPU 频率就是每秒内的 CPU 计算次数(但是单精双精浮点运算时 CPU 时间片是不一样的,这个要注意下)。

下面我们只从取出的值的结果来做计算。

如果想用 ps 像 top 一样计算一定时间周期内的 CPU 使用率,可以按如下方式计算。

[root@7dgroup 2287]# ps -p 2287 -o %cpu,cputime,etime,etimes
%CPU     TIME     ELAPSED ELAPSED
0.3 00:00:00       01:03      63

这里有两个参数,etime 和 etimes(这两个参数的 header 都是 ELAPSED),这两个参数别是:

  • etime:线程自启动以来的持续时间,格式是 [DD-]hh:]mm:ss

  • etimes:线程自启动以来的持续时间,以秒为单位。

比如说,上面这个 2287 进程,在第一次取值时,如上所示。

要计算到当前时间消耗了多少 CPU ,需要再取一次数据:

[root@7dgroup 2287]# ps -p 2287 -o %cpu,cputime,etime,etimes
%CPU     TIME     ELAPSED ELAPSED
 0.3 00:00:01       04:30     270

计算一下时间:

前一次取值时:

  • CPU 时间片消耗是:0。计算过程是:(003600+0060+00)

  • CPU 时间窗口是63。计算过程是:1*60+3 = 63.

后一次取值时:

  • CPU 时间片消耗是:1。计算过程是:003600+0060+1

  • CPU 时间窗口是:270。计算过程是:4*60+30 = 270.

CPU 使用率计算是:
$$ ((1-0)/(270-63))*100 = 0.4 $$
所以这个进程在这段时间内所用的 CPU 百分比是 0.4%。

有兴趣的也可以撸一下 ps 的源代码:

image.png
如果对 top 计算结果有异议的,也可以去撸下 top 的源码。

四、总结

上面逻辑了这么多,那么我们在看一个系统的资源使用率时,要看 ps 还是 top 呢?

ps 和 top 的关系如下所示:
image.png
top 是一个时间周期内的资源统计。ps 是一个个时间点的资源值。

如果要监控一个系统的整体资源使用率的话,建议用 top 来看。

如果要分析到一个具体的线程使用的 CPU 资源时,再用 ps 来看。

目录
相关文章
|
8月前
|
运维 Linux 虚拟化
Linux 查看 CPU 使用情况
在 Linux 系统中,查看 CPU 使用情况是性能分析和故障排查的重要环节。查看 CPU 使用情况,使用 top 命令或者 htop 命令来查看。
|
5月前
|
存储 缓存 程序员
软考软件评测师——计算机组成与体系结构(CPU指令系统)
本内容详细解析了计算机中央处理器(CPU)的核心架构及其关键组件的工作原理。首先介绍了CPU的四大核心模块:运算单元、控制单元、寄存器阵列和内部总线,并阐述其在数据处理中的核心职责。接着深入探讨了算术逻辑部件(ALU)的功能与专用寄存器的作用,以及通用寄存器对性能提升的意义。随后分析了控制单元的指令处理流程及特殊寄存器的功能。此外,还解析了寄存器系统的分类与设计特点,并对比了不同内存访问模式的特点与应用场景。最后,通过历年真题巩固相关知识点,帮助理解CPU各组件的协同工作及优化策略。
|
8月前
|
Ubuntu Linux 应用服务中间件
Linux使用cpulimit对CPU使用率进行限制
cpulimit是一款简单易用的CPU使用率限制工具,支持对特定程序或整个CPU使用率进行限制。可通过源安装(如`yum`或`apt-get`)或编译安装获取。使用时,可针对程序名、进程号或绝对路径设置CPU占用上限(如`cpulimit -e xmrig -l 60 -b`)。ROOT用户可限制所有进程,普通用户仅限于权限范围内进程。注意,CPU百分比基于实际核心数(单核100%,双核200%,依此类推)。
606 7
|
8月前
|
存储 缓存 Linux
Linux系统中如何查看CPU信息
本文介绍了查看CPU核心信息的方法,包括使用`lscpu`命令和读取`/proc/cpuinfo`文件。`lscpu`能快速提供逻辑CPU数量、物理核心数、插槽数等基本信息;而`/proc/cpuinfo`则包含更详细的配置数据,如核心ID和处理器编号。此外,还介绍了如何通过`lscpu`和`dmidecode`命令获取CPU型号、制造商及序列号,并解释了CPU频率与缓存大小的相关信息。最后,详细解析了`lscpu`命令输出的各项参数含义,帮助用户更好地理解CPU的具体配置。
896 8
|
10月前
|
Windows
【Azure App Service】对App Service中CPU指标数据中系统占用部分(System CPU)的解释
在Azure App Service中,CPU占比可在App Service Plan级别查看整个实例的资源使用情况。具体应用中仅能查看CPU时间,需通过公式【CPU Time / (CPU核数 * 60)】估算占比。CPU百分比适用于可横向扩展的计划(Basic、Standard、Premium),而CPU时间适用于Free或Shared计划。然而,CPU Percentage包含所有应用及系统占用的CPU,高CPU指标可能由系统而非应用请求引起。详细分析每个进程的CPU占用需抓取Windows Performance Trace数据。
214 40
|
10月前
|
缓存 安全 Linux
Linux系统查看操作系统版本信息、CPU信息、模块信息
在Linux系统中,常用命令可帮助用户查看操作系统版本、CPU信息和模块信息
1917 23
|
监控 Java 开发者
Java一分钟之-Java性能分析与调优:JProfiler, VisualVM等工具
【5月更文挑战第21天】本文介绍了Java性能优化的两个利器——JProfiler和VisualVM。JProfiler通过CPU Profiler、内存分析器和线程视图帮助解决过度CPU使用、内存泄漏和线程阻塞问题;VisualVM则聚焦于GC行为调整和类加载优化,以减少内存压力和提高应用性能。使用这些工具进行定期性能检查,是提升Java应用效率的关键。
447 0
|
缓存 监控 Linux
Linux性能分析利器:全面掌握perf工具
【10月更文挑战第18天】 在Linux系统中,性能分析是确保软件运行效率的关键步骤。`perf`工具,作为Linux内核自带的性能分析工具,为开发者提供了强大的性能监控和分析能力。本文将全面介绍`perf`工具的使用,帮助你成为性能优化的高手。
719 1
|
缓存 监控 Linux
掌握Linux性能分析:深入探索perf工具
【10月更文挑战第26天】
549 1
|
SQL 缓存 关系型数据库
MySQL高级篇——性能分析工具
MySQL的慢查询日志,用来记录在MySQL中响应时间超过阀值的语句,具体指运行时间超过long-query_time值的SQL,则会被记录到慢查询日志中。long_query_time的默认值为 10,意思是运行10秒以上(不含10秒)的语句,认为是超出了我们的最大忍耐时间值。它的主要作用是,帮助我们发现那些执行时间特别长的 SOL 查询,并且有针对性地进行优化,从而提高系统的整体效率。当我们的数据库服务器发生阻塞、运行变慢的时候,检查一下慢查询日志,找到那些慢查询,对解决问题很有帮助。
MySQL高级篇——性能分析工具