- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

GaussDB(DWS)应急预案（三）：CPU整体使用率高

Arrow0lf 发表于 2023/12/27 19:43:42 2023/12/27

【摘要】 DWS CPU整体使用率高应急预案

1.1 CPU整体使用率高（预计10min）

1.1.1 应急步骤

部署gs_cpuwatcher脚本
查杀当前执行时间长的语句，得到拼接的查杀命令如下:

select 'execute direct on(' || coorname || ') ''select pg_cancel_backend(' || pid || ')'';', sysdate - query_start as dur, state, query_id, enqueue, query from pgxc_stat_activity where state <> 'idle' and usename <> 'omm' and usename <> 'Ruby' order by dur desc limit 100;

查杀CPU使用率高的语句，得到的拼接查杀命令如下：

SELECT 'execute direct on(' || s.nodename || ') ''select pg_cancel_backend(' || s.threadid || ')'';', s.node_group::name AS nodegroup,s.resource_pool rpname, CAST(ROUND(res.total_cpu_time/ng.dn_cnt/(res.duration+1),3) AS DOUBLE PRECISION) AS used_cpu, s.elapsed_time AS duration_s, substr(a.query,1,10), a.query_start,s.block_time, res.query_band,s.attribute,s.lane, ( CASE WHEN s.enqueue != 'None' AND s.status = 'pending' THEN 'pending' ELSE 'running' END ) AS status, ( CASE WHEN s.enqueue = 'None' OR s.status != 'pending' THEN 'None' WHEN s.enqueue='Global' THEN 'Global' WHEN s.enqueue = 'CentralQueue' THEN 'CCN' WHEN s.enqueue = 'Respool' THEN 'Respool' WHEN ccn.on AND s.lane = 'slow' THEN 'CCN' ELSE 'Respool' END ) AS queue, res.max_peak_memory AS used_mem,s.statement_mem AS estimate_mem, COALESCE(thread.dn_cnt, 0) AS dn_count,COALESCE(thread.stream_cnt, 0) AS stream_count,a.query_id FROM pg_catalog.pgxc_session_wlmstat s, pg_catalog.pgxc_stat_activity a, ( SELECT MAX(query_band) AS query_band,MAX(max_peak_memory) AS max_peak_memory,MAX(total_cpu_time) AS total_cpu_time, MAX(duration) AS duration,queryid FROM pg_catalog.pgxc_wlm_session_statistics GROUP BY queryid ) res, ( SELECT (setting='on') AS on FROM pg_catalog.pg_settings WHERE name='enable_dynamic_workload' ) ccn, ( SELECT query_id, SUM(CASE WHEN tlevel > 0 AND node_name LIKE '%dn%' THEN 1 ELSE 0 END) AS stream_cnt, SUM(CASE WHEN tlevel = 0 AND node_name LIKE '%dn%' THEN 1 ELSE 0 END) AS dn_cnt, SUM(CASE WHEN node_name LIKE '%cn%' then 1 ELSE 0 END) AS cn_cnt FROM pg_catalog.pgxc_thread_wait_status GROUP BY 1 ) thread, ( SELECT (CASE is_installation WHEN true THEN 'installation'::name ELSE group_name::name END) AS group_name, array_length(group_members,1) AS dn_cnt FROM pg_catalog.pgxc_group ) ng WHERE s.threadid = a.pid(+) AND a.query_id = thread.query_id(+) AND a.query_id = res.queryid(+) AND s.node_group = ng.group_name AND s.resource_pool != 'root' AND s.status NOT IN ('finished','aborted','active','unknown') AND a.state = 'active' AND a.query NOT LIKE '%pgxc_session_wlmstat%' AND a.query NOT LIKE '%pgxc_stat_activity%' ORDER BY used_cpu desc nulls last , s.status,s.priority DESC,a.query_start;

找到CPU使用率高的用户，并应急锁定该用户：

SELECT u.usename, u.nodegroup, u.respool, r.short_acc, coalesce(ss.session_cnt, 0) AS session_cnt, coalesce(ss.slow_run, 0) AS slow_run, coalesce(ss.slow_wait, 0) AS slow_wait, (CASE WHEN r.active_statements>0 THEN r.active_statements*ccn.cnt ELSE r.active_statements END) AS slow_limit, coalesce(ss.fast_run, 0) AS fast_run, coalesce(ss.fast_wait, 0) AS fast_wait, (CASE WHEN r.max_dop>0 THEN r.max_dop*cn.cnt ELSE r.max_dop END) AS fast_limit, DECODE(coalesce(ur.total_cpu, c.total_cpu), 0, c.total_cpu, coalesce(ur.total_cpu, c.total_cpu))/(c.total_cpu)*100 AS cpu_percent, ur.used_cpu/(g.node_cnt/dn.cnt) AS used_cpu, DECODE(coalesce(ur.total_cpu, c.total_cpu), 0, c.total_cpu, coalesce(ur.total_cpu, c.total_cpu))/(g.node_cnt/dn.cnt) total_cpu, ( CASE WHEN r.mem_percent = 0 THEN 100 WHEN r.mem_percent*ccn.cnt > 100 THEN 100 ELSE r.mem_percent*ccn.cnt END ) AS mem_percent, coalesce(ss.est_mem, 0) AS est_mem_mb, ur.used_memory/g.node_cnt used_mem_mb, ( CASE WHEN r.mem_percent=0 OR r.mem_percent=100 THEN concat(ROUND(ur.total_memory/g.node_cnt/1024, 2), 'GB') WHEN DECODE(r.mem_percent, 0, 100, r.mem_percent)*ccn.cnt > 100 THEN concat(ROUND(ur.total_memory/g.node_cnt/mem_percent*100/1024, 2), 'GB') ELSE concat(ROUND(ur.total_memory/g.node_cnt*ccn.cnt/1024, 2), 'GB') END ) AS total_mem, ( CASE WHEN r.memory_limit = 'default' THEN CASE WHEN DECODE(ur.total_memory, 0, c.total_mem, ur.total_memory) is NULL THEN concat(0, 'GB') WHEN DECODE(ur.total_memory, 0, c.total_mem, ur.total_memory) = 0 THEN concat(0, 'GB') WHEN DECODE(ur.total_memory, 0, c.total_mem, ur.total_memory) > 1024 THEN concat(ROUND(DECODE(ur.total_memory, 0, c.total_mem, ur.total_memory)/g.node_cnt*4/10/1024, 2), 'GB') ELSE concat((DECODE(ur.total_memory, 0, c.total_mem, ur.total_memory)/g.node_cnt*4/10)::INT, 'MB') END ELSE r.memory_limit END ) AS query_mem_limit, ur.read_speed/1024 read_speed_mbs, ur.write_speed/1024 write_speed_mbs, ur.used_space/1024/1024 AS used_space, (CASE WHEN ur.total_space < 0 THEN -1 ELSE ur.total_space/1024/1024 END) AS total_space, ur.used_temp_space/1024/1024 AS used_temp_space, (CASE WHEN ur.total_temp_space < 0 THEN -1 ELSE ur.total_temp_space/1024/1024 END) AS total_temp_space, ur.used_spill_space/1024/1024 AS used_spill_space, (CASE WHEN ur.total_spill_space < 0 THEN -1 ELSE ur.total_spill_space/1024/1024 END) AS total_spill_space FROM pg_user u, pg_total_user_resource_info ur, ( SELECT rr.respool_name,rr.memory_limit,rr.short_acc,rr.active_statements,rr.max_dop, ( CASE WHEN rr.parentid = 0 THEN rr.mem_percent ELSE (SELECT mem_percent FROM pg_resource_pool WHERE oid=rr.parentid)*rr.mem_percent/100 END ) mem_percent FROM pg_resource_pool rr ) r, ( SELECT DISTINCT coalesce(au.nodegroup, 'installation') AS nodegroup, AVG(CASE WHEN total_cpu = 0 THEN -1 ELSE total_cpu END) AS total_cpu, AVG(CASE WHEN total_memory = 0 THEN -1 ELSE total_memory END) AS total_mem FROM pg_total_user_resource_info rr, pg_user au WHERE rr.username = au.usename AND au.respool = 'default_pool' AND au.usesysid!=10 GROUP BY 1 ) c, ( SELECT count(*) node_cnt, group_name FROM (SELECT (CASE is_installation WHEN true THEN 'installation' ELSE group_name END), unnest(group_members) FROM pgxc_group) GROUP BY 2 ) g, ( SELECT usename, count(1) AS session_cnt, SUM(CASE WHEN lane= 'fast' AND status = 'running' THEN 1 ELSE 0 END) AS fast_run, SUM(CASE WHEN lane= 'fast' AND enqueue != 'None' AND status = 'pending' THEN 1 ELSE 0 END) AS fast_wait, SUM(CASE WHEN lane= 'slow' AND status = 'running' THEN 1 ELSE 0 END) AS slow_run, SUM(CASE WHEN lane= 'slow' AND enqueue != 'None' AND status = 'pending' THEN 1 ELSE 0 END) AS slow_wait, SUM(CASE status WHEN 'running' THEN statement_mem ELSE 0 END) AS est_mem FROM pgxc_session_wlmstat GROUP BY 1 ) ss, ( SELECT node_host,count(1) as cnt FROM pgxc_node WHERE node_type = 'D' GROUP BY 1 limit 1 ) dn, ( SELECT ( CASE WHEN setting='on' THEN 1 ELSE (SELECT COUNT(1) FROM pgxc_node WHERE node_type = 'C') END ) AS cnt FROM pg_settings WHERE name='enable_dynamic_workload' ) ccn, ( SELECT COUNT(1) cnt FROM pgxc_node WHERE node_type = 'C' ) cn WHERE u.respool = r.respool_name(+) and coalesce(u.nodegroup, 'installation') = c.nodegroup(+) and coalesce(u.nodegroup, 'installation') = g.group_name(+) and u.usename = ur.username(+) and u.usename = ss.usename(+) and u.usesysid != 10 order by used_cpu desc;

alter user usename account lock;

根据gs_cpuwatcher结果，查杀cpu占用高的语句。该脚本会在当前目录会生成log的日志，输出日志内容如下：

使用对应语句的pid，查杀该语句：

execute direct on(node_name) 'select pg_cancel_backend(pid)';

由于短查询CPU不受控，若用户持续高并发下发短查询，可应急锁定该用户，或通过资源池限制该用户短查询并发。

SELECT usename ,coorname ,enqueue ,count(*) FROM pgxc_stat_activity WHERE STATE = 'active' AND usename <> 'omm' AND usename <> 'Ruby' GROUP BY 1,2,3 ORDER BY 4 desc;

alter user usename account lock;

资源池限制短查询并发方法：资源管理->资源池->编辑->简单语句并发

排查语句残留场景，并应急查杀残留语句：

select 'execute direct on(' || node_name || ') ''select pg_cancel_backend(' || tid || ')'';' , node_name,tid,query_id from pgxc_thread_wait_status b where not exists (select query_id from pgxc_thread_wait_status a where a.node_name like 'c%' and a.query_id=b.query_id) and b.node_name like 'd%' and b.wait_status not in ('wait cmd') and b.tid <> pg_backend_pid();

若上述手段均无效果，考虑应急重启集群恢复

1.1.2 恢复确认

确认CPU是否下降至80%以下。

1.1.3 原因分析

当集群出现CPU使用率高的告警时，首先应在任意一个CPU高的节点部署gs_cpuwatcher脚本，同时，查看当前活跃视图中的语句执行情况，可通过如下语句查看sql级别的CPU使用情况：

SELECT s.usename,s.nodename,s.node_group::name AS nodegroup,s.resource_pool rpname, CAST(ROUND(res.total_cpu_time/ng.dn_cnt/(res.duration+1),3) AS DOUBLE PRECISION) AS used_cpu, s.elapsed_time AS duration_s, substr(a.query,1,100), ( CASE WHEN s.priority = 8 THEN 'Rush' WHEN s.priority = 4 THEN 'High' WHEN s.priority = 2 THEN 'Medium' WHEN s.priority = 1 THEN 'Low' ELSE 'Invalid' END )::name AS priority, a.xact_start,a.query_start,s.block_time, res.query_band,s.attribute,s.lane, ( CASE WHEN s.enqueue != 'None' AND s.status = 'pending' THEN 'pending' ELSE 'running' END ) AS status, ( CASE WHEN s.enqueue = 'None' OR s.status != 'pending' THEN 'None' WHEN s.enqueue='Global' THEN 'Global' WHEN s.enqueue = 'CentralQueue' THEN 'CCN' WHEN s.enqueue = 'Respool' THEN 'Respool' WHEN ccn.on AND s.lane = 'slow' THEN 'CCN' ELSE 'Respool' END ) AS queue, res.max_peak_memory AS used_mem,s.statement_mem AS estimate_mem, COALESCE(thread.dn_cnt, 0) AS dn_count,COALESCE(thread.stream_cnt, 0) AS stream_count, s.threadid AS pid,s.processid AS lwtid,a.query_id, a.query FROM pg_catalog.pgxc_session_wlmstat s, pg_catalog.pgxc_stat_activity a, ( SELECT MAX(query_band) AS query_band,MAX(max_peak_memory) AS max_peak_memory,MAX(total_cpu_time) AS total_cpu_time, MAX(duration) AS duration,queryid FROM pg_catalog.pgxc_wlm_session_statistics GROUP BY queryid ) res, ( SELECT (setting='on') AS on FROM pg_catalog.pg_settings WHERE name='enable_dynamic_workload' ) ccn, ( SELECT query_id, SUM(CASE WHEN tlevel > 0 AND node_name LIKE '%dn%' THEN 1 ELSE 0 END) AS stream_cnt, SUM(CASE WHEN tlevel = 0 AND node_name LIKE '%dn%' THEN 1 ELSE 0 END) AS dn_cnt, SUM(CASE WHEN node_name LIKE '%cn%' then 1 ELSE 0 END) AS cn_cnt FROM pg_catalog.pgxc_thread_wait_status GROUP BY 1 ) thread, ( SELECT (CASE is_installation WHEN true THEN 'installation'::name ELSE group_name::name END) AS group_name, array_length(group_members,1) AS dn_cnt FROM pg_catalog.pgxc_group ) ng WHERE s.threadid = a.pid(+) AND a.query_id = thread.query_id(+) AND a.query_id = res.queryid(+) AND s.node_group = ng.group_name AND s.resource_pool != 'root' AND s.status NOT IN ('finished','aborted','active','unknown') AND a.state = 'active' AND a.query NOT LIKE '%pgxc_session_wlmstat%' AND a.query NOT LIKE '%pgxc_stat_activity%' ORDER BY used_cpu desc nulls last , s.status,s.priority DESC,a.query_start;

其中关键字段含义如下：

used_cpu: CPU使用百分比；

duration_s: 语句执行时间；

stream_count: 语句中的stream个数；

统计各用户的CPU使用：

统计各资源池上的CPU使用：

SELECT rp.rpname, rp.nodegroup, coalesce(ss.session_cnt, 0) AS session_cnt, xc.ref_count active_cnt, coalesce(ss.fast_run,0) AS fast_run,xc.fast_run AS in_fast_run, coalesce(ss.fast_wait,0) AS fast_wait,xc.fast_wait AS in_fast_wait, (CASE WHEN rp.fast_limit>0 THEN rp.fast_limit*cn.cnt ELSE rp.fast_limit END) AS fast_limit, coalesce(ss.slow_run,0) AS slow_run,xc.slow_run AS in_slow_run, coalesce(ss.slow_wait,0) AS slow_wait,xc.slow_wait AS in_slow_wait, (CASE WHEN rp.slow_limit>0 THEN rp.slow_limit*ccn.cnt ELSE rp.slow_limit END) AS slow_limit, rp.used_cpu/(node_cnt/n.cnt) used_cpu, rp.cpu_limit/(node_cnt/n.cnt) total_cpu, rp.used_mem/node_cnt used_mem_mb, coalesce(ss.est_mem,0) AS est_mem_mb, xc.est_mem AS in_est_mem_mb, ( CASE WHEN r.mem_percent = 0 THEN 100 WHEN r.mem_percent*ccn.cnt > 100 THEN 100 ELSE r.mem_percent*ccn.cnt END ) AS mem_percent, ( CASE WHEN r.mem_percent=0 OR r.mem_percent=100 THEN concat(ROUND(rp.mem_limit/g.node_cnt/1024, 2), 'GB') WHEN r.mem_percent*ccn.cnt > 100 THEN concat(ROUND(rp.mem_limit/g.node_cnt/r.mem_percent*100/1024, 2), 'GB') ELSE concat(ROUND(rp.mem_limit/g.node_cnt*ccn.cnt/1024, 2), 'GB') END ) AS total_mem, ( CASE WHEN r.memory_limit = 'default' THEN CASE WHEN rp.mem_limit is NULL THEN concat(0, 'GB') WHEN rp.mem_limit = 0 THEN concat(0, 'GB') WHEN rp.mem_limit > 1024 THEN concat(ROUND(rp.mem_limit/g.node_cnt*4/10/1024, 2), 'GB') ELSE concat((rp.mem_limit/g.node_cnt*4/10)::INT, 'MB') END ELSE r.memory_limit END ) AS query_mem_limit, rp.read_speed/1024 read_speed_mbs, rp.write_speed/1024 write_speed_mbs FROM ( SELECT rr.respool_name,rr.memory_limit, ( CASE WHEN rr.parentid = 0 THEN rr.mem_percent ELSE (SELECT mem_percent FROM pg_resource_pool WHERE oid=rr.parentid)*rr.mem_percent/100 END ) mem_percent FROM pg_resource_pool rr ) r, gs_respool_resource_info rp, ( SELECT rpname, nodegroup, SUM(ref_count) ref_count, SUM(fast_run) fast_run, SUM(fast_wait) fast_wait, SUM(slow_run) slow_run, SUM(slow_wait) slow_wait, SUM(estimate_mem) est_mem FROM pgxc_respool_resource_info WHERE nodename like '%cn%' GROUP BY 1,2 ) xc, ( SELECT resource_pool AS rpname, node_group, SUM(cnt) AS session_cnt, SUM(CASE WHEN lane= 'fast' and status = 'running' THEN cnt ELSE 0 END) AS fast_run, SUM(CASE WHEN lane= 'fast' and enqueue != 'None' and status = 'pending' THEN cnt ELSE 0 END) AS fast_wait, SUM(CASE WHEN lane= 'slow' and status = 'running' THEN cnt ELSE 0 END) AS slow_run, SUM(CASE WHEN lane= 'slow' and enqueue != 'None' and status = 'pending' THEN cnt ELSE 0 END) AS slow_wait, SUM(CASE status WHEN 'running' THEN est_mem ELSE 0 END) AS est_mem FROM (SELECT resource_pool, node_group, lane, enqueue, status, count(1) as cnt, SUM(statement_mem) as est_mem FROM pgxc_session_wlmstat GROUP BY 1,2,3,4,5) GROUP BY 1,2 ) ss, ( SELECT count(*) node_cnt, group_name FROM (SELECT group_name, unnest(group_members) FROM pgxc_group) GROUP BY 2 ) g, ( SELECT node_host,count(1) as cnt FROM pgxc_node WHERE node_type = 'D' GROUP BY 1 limit 1 ) n, ( SELECT ( CASE WHEN setting='on' THEN 1 ELSE (SELECT COUNT(1) FROM pgxc_node WHERE node_type = 'C') END ) AS cnt FROM pg_settings WHERE name='enable_dynamic_workload' ) ccn, ( SELECT COUNT(1) cnt FROM pgxc_node WHERE node_type = 'C' ) cn WHERE rp.rpname = ss.rpname(+) and rp.nodegroup = ss.node_group(+) and rp.rpname = r.respool_name(+) and rp.nodegroup = g.group_name(+) and rp.nodegroup = xc.nodegroup(+) and rp.rpname = xc.rpname(+) and INSTR(rp.cgroup,':') order by used_cpu desc;

根据gs_cpuwatcher脚本监控结果分析语句情况，对于CPU占用高的语句，可以对涉及的相关表手动analyze观察效果。
配置资源池的场景下，若开启短查询加速且未限制短查询并发数，可能会导致短查询在并发高的场景下资源使用不受控，导致CPU使用率高，此时，可以考虑限制资源池的短查询并发数，或应急锁定该用户。
若上述手段均无效果，可以考虑应急重启集群恢复（可能是多个节点语句残留的场景）。

1.1.4 预防再次出现

根据用户划分不同资源池，设置cpu限额
设置异常规则或statement_timeout参数，防止单语句执行时间过长
限制资源池快车道并发，防止短查询加速不受控导致CPU高

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入