性能分析之从 CPU 高到定位到代码行(C/C++)

举报
zuozewei 发表于 2021/09/14 23:05:29 2021/09/14
【摘要】 如果分析思路方向是正确的,对于 Java 应用和 C/C++ 应用来说,也是几个命令就可以跳到代码行了。前提是要能看得懂堆栈信息。

前言

如果分析思路方向是正确的,对于 Java 应用和 C/C++ 应用来说,也是几个命令就可以跳到代码行了。前提是要能看得懂堆栈信息。所以一直以来我在讲课的过程中都有画过这样的一个分析思路的图。

在这里插入图片描述

在性能分析中,如果是 C/C++ 的应用的话,也同样是有些工具可以做得到的。

一个例子

今天我们来看一个简单的 C 代码示例,看下如何做到这几步。我在网上看到有一段示例代码,也省得自己写了。就直接拿来编译用了。下面来看一下操作。

[root@7dgroup Sample6]# gcc -o test6 -g test6.c

#编译的时候记得加-g的参数,可以生成调试信息。
[root@7dgroup Sample6]# ./test6

# 运行起来:
[root@7dgroup Sample6]# ./test6
返回值 :3
返回值 5
返回值 :5
返回值 7
返回值 :7
返回值 9

执行过程会产生这样的数据。同时查看top。
在这里插入图片描述

看到 31356 这个进程已经消耗了 CPU。因为这个进程非常的简单,所以这里我就不再细化到线程级了。直接打堆栈看了。
(如果是复杂的应用的话,在这一步,还要再细化一步的就是打印线程级的状态。方法有多种,可以用 top -H,也可以 pidstat,也可以用调试工具 attach 上去再查 threaddump。总之选择自己喜欢的方式就好。)

直接 gstack 打印堆栈。

[root@7dgroup ~]# gstack 31356
#0  0x00000000004005ed in function2 (input=963) at test6.c:4
#1  0x000000000040065b in function1 (a=9, b=10) at test6.c:21
#2  0x00000000004006e8 in main () at test6.c:39

# 当然你也可以pstack打印堆栈(因为我重新运行了一次,所以PID变了)。
[root@7dgroup ~]# pstack 31438
#0  0x0000000000400620 in function3 (input=3524) at test6.c:14
#1  0x000000000040067e in function1 (a=5, b=6) at test6.c:25
#2  0x00000000004006e8 in main () at test6.c:39

通过堆栈信息就可以看出来,这里面只有一个线程,并且调用关系是:

  • 第一次打印的堆栈是:39行 -> 21行 -> 4行
  • 第二次打印的堆栈是:39行 -> 25行 -> 14行

(因为是同一个文件,所以我只写行号了)。

这样就可以在 C/C++ 的应用中从 CPU 分析到具体的代码行了。

小结

再重复强调,分析思路的完整性非常重要。要先知道想看什么数据,才能知道用什么工具去做。会工具没什么了不起,但是把原理搞清楚又能融会贯通才是真的厉害。

可能有人会说,我连工具都不知道怎么用,怎么知道看什么数据呢。看似悖论的一个问题,实际上就是经验不足,需要多学习基础的知识。
比如说,了解了 Linux 上运行java语言的分析过程,那其他的分析过程也是类似的,只是工具不同。并不是说只会分析 Linux 上运行Java,换成 HPunix+C/C++ 就没有思路了。

就像小学做的数学题一样:一行有四棵树,总共四行,共有几棵树?16棵!
但是把树换成电线杆就有人不会算了。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。