GaussDB(DWS)长期稳定性测试

举报
ACBD 发表于 2021/09/02 09:51:39 2021/09/02
【摘要】 长期稳定性测试目的主要是保证在作业长时间持续过程中,系统、集群、数据库等均正常且符合预期。所以要观测的项较多且杂,问题也不易于发觉。主要分为观测点包括实例内存实例内存可以通过在实例上执行select * from pg_total_memory_detail查看,或者执行with a as (select * from pgxc_total_memory_detail where memor...

长期稳定性测试目的主要是保证在作业长时间持续过程中,系统、集群、数据库等均正常且符合预期。所以要观测的项较多且杂,问题也不易于发觉。主要分为观测点包括

  • 实例内存

实例内存可以通过在实例上执行select * from pg_total_memory_detail查看,或者执行with a as (select * from pgxc_total_memory_detail where memorytype='dynamic_used_memory'), b as (select * from pgxc_total_memory_detail where memorytype='dynamic_peak_memory'), c as (select * from pgxc_total_memory_detail where memorytype='max_dynamic_memory'), d as (select * from pgxc_total_memory_detail where memorytype='process_used_memory'), e as (select * from pgxc_total_memory_detail where memorytype='other_used_memory'), f as (select * from pgxc_total_memory_detail where memorytype='sctpcomm_used_memory'), g as (select * from pgxc_total_memory_detail where memorytype='sctpcomm_peak_memory'), h as (select * from pgxc_total_memory_detail where memorytype='max_sctpcomm_memory'), i as (select * from pgxc_total_memory_detail where memorytype='max_process_memory') select a.nodename,a.memorymbytes as dynamic_used_memory, b.memorymbytes as dynamic_peak_memory, c.memorymbytes as max_dynamic_memory, d.memorymbytes as process_used_memory,e.memorymbytes as other_used_memory, f.memorymbytes as sctpcomm_used_memory, g.memorymbytes as sctpcomm_peak_memory, h.memorymbytes as max_sctpcomm_memory, i.memorymbytes as max_process_memory from a,b,c,d,e,f,g,h,i where a.nodename=b.nodename and b.nodename=c.nodename and c.nodename=d.nodename and d.nodename=e.nodename and e.nodename=f.nodename and f.nodename=g.nodename and g.nodename=h.nodename and h.nodename=i.nodename order by a.nodename;查看所有CNDN内存相关信息。


         CmsGTM等相关内存需要通过top命令获取。

  • 系统资源

系统资源包括各项CPU占用、各类IO、网络状况等。主要是通过系统命令来获取。

  • context-session

主要是session的相关信息,通过sql语句select * from pv_session_memory_detail;可以查询出每个session对应的信息。通常在查询条件里增加按照内存大小排序或者查询特定的session信息。

  • context—share

share内存通过select * from pg_shared_memory_detail查询,查询shared memory的占用情况

  • 其他检测项

包括coreerror、僵尸进程、fetal等,这部分既包含sql语句查询,也包含linux命令查询。

因为长期稳定性测试观察点很多,所以很容易遗漏问题。而且会遇到的各种各样的问题,有些时候识别不出来就会存在风险。且消耗人力较多,尽快将长稳测试自动化或半自动化可以有效提高测试效率

 【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请发送邮件至:cloudbbs@huaweicloud.com;如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。