7DGroup性能实施项目日记7

举报
zuozewei 发表于 2024/03/18 15:20:27 2024/03/18
【摘要】 7DGroup性能实施项目日记7

九月廿五 壬寅年 虎 庚戌月 丙午日

从昨天的场景执行和结果分析来看,效果有一些。今天我们又换了一个接口,看看有什么新问题。
从我的 RESAR 性能工程的逻辑上来看,现在是在基准场景执行的阶段。在这个阶段就是要把每个接口都单独压到最大tps,并且一定要明确瓶颈点。比如说在登录接口中,递增压力线程直到tps不再上升,然后通过分析压力数据的趋势和全局监控的计数器来判断当前的瓶颈点在哪,给出明确结论。也就是根据 RESAR 性能分析七步法的逻辑。如下:

image.png

在这个接口上,可以看到如下压力场景的数据。

image.png
image.png

tps曲线锯齿比较明显,响应时间也有对应的趋势。根据RESAR性能分析七步法,显然第一步的判断是有瓶颈,而要找到对应的瓶颈点,就得走下面的六步才可以。

通过架构图和代码的调用逻辑,可以明确这个接口涉及的技术组件有gateway、member服务、auth服务、redis、mysql。
image.png
image.png

用 Skywalking 拆分响应时间。
image.png
image.png

然后通过全局监控逻辑和定向监控逻辑,可以看到有几个问题。

image.png

第一:数据库cpu整体使用率并不高,但也明显有了io wait的情况,这是一个需要优化的瓶颈点。

image.png

第二:通过对应用的全局监控和定向监控,可以看到应用的内存初始值过小,ygc还是比较频繁,这是另一个需要优化的瓶颈点。

image.png
image.png

通过以上图可以看到我们后续的优化方向是很明确的。后面我们会对这些瓶颈点一一执行优化动作。
其实对于性能分析来说,找到这个瓶颈点,比优化这个瓶颈点要难得多。在我们这几天的执行来说,经常看到所有人都能看到所有的数据,但是下一步要干什么就是一头雾水。而这关键的分析环境需要的技术功底就比较多。

我们之所以花这么大的时间和成本来搭建完整的性能项目给7DGroup学员们锻炼,也主要是为了把这个分析逻辑的细节真实地体现出来。

并且所有人都可以看所有技术细节,权限也给到最大。在这样的环境中,没有部门岗位产生的权限壁垒,没有不可见的技术细节,没有因为私心而不愿意做的技术分享,也没有教会学生饿死师傅的担心。

怕的是:不用心。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。