GaussDB(DWS) 监控运维诊断优化,历史查询诊断

举报
华为云数仓DWS 发表于 2024/11/12 17:33:20 2024/11/12
【摘要】 DWS历史查询诊断,基于DWS集群历史topsql,提供异常诊断能力,对SQL语句进行静态检查,执行计划解析可视化及诊断,帮助客户识别烂SQL并做诊断,提升租户自运维能力。

DWS历史查询诊断,基于DWS集群历史topsql,提供异常诊断能力。提供SQL趋势统计分析曲线图,展示SQL历史运行趋势;提供历史topsql异常诊断能力,识别资源占用高,运行时间长,以及运行异常的烂SQL,展示各类异常SQL数量,并支持过滤各类异常SQL;提供单SQL的一键诊断能力,一键诊断能力包括SQL语句检查,执行计划诊断和可视化,帮助客户分析执行计划,分析SQL语句执行性能消耗,提升租户侧自运维能力。

核心功能

功能使用

登录数据仓库服务,选择优化诊断菜单

左侧菜单栏选择优化诊断菜单,会进到优化诊断功能界面,在集群列表中选中集群,第一个tab页就是历史查询分析。

提示:此功能依赖历史查询监控指标,需要集群开启历史查询监控才能正常使用,集群如果未开启监控设置,可从此界面开启。

趋势统计

界面上方是历史查询趋势统计,提供三个tab页切换,分别为历史查询总趋势,SQL质量趋势,SQL运行时长趋势。

历史查询总趋势:支持按照不同维度(集群/用户/实例/应用名称/资源池),指定时间范围内,统计每分钟执行SQL数量。

SQL质量趋势:统计指定时间范围内,每类异常项的SQL数量。 SQL运行时长趋势:统计集群历史SQL执行时间(平均时长/最大时长/最小时长)。

SQL异常诊断,质量概览

界面中间部分,提供SQL质量概览,显示各类异常SQL数量,点击卡片下方列表同步过滤。

异常项:不下推/CPU超过10万秒/Not in子查询/时长超过1小时/内存超过10G/下盘超过50G/streaming数量超过50

不同集群,可调整异常项的阈值,异常诊断规则基于DWS集群历史topsql字段可灵活配置。

历史topsql详情

界面最下方部分,显示历史topsql详情列表,支持条件搜索和全字段排序。

默认显示查询ID,用户名称,数据库名称,提交时间,执行时间,查询语句,查询状态等字段,想要查看更多字段可点击右上角齿轮图标设置显示字段。 点击查看详情按钮可查看历史topsql详情


历史topsql数据汇总

历史topsql数据汇总,按照不同维度对历史topsql做汇总,显示SQL数量,和资源消耗情况。

维度:数据库/用户/资源池/应用名称/实例/uniqueSQLId

一键诊断-执行计划诊断

针对执行计划格式,对执行计划字符串进行解析,对历史topsql表中记录的执行计划进行诊断,并提供可视化图形,可以展示每个节点执行时长,type,扫描行数等信息。

异常诊断项:重分布异常,估算异常,计算倾斜,分区扫描异常,跨逻辑集群查询。

注意:集群历史topsql需要设置为perf级别才可以显示每步执行时长,需要设置guc参数resource_track_level=perf

一键诊断-SQL语句检查

对用户编写的SQL语句,结合现网经验,总结了12条SQL军规,对SQL语句进行静态检查,可以分析烂SQL,并给出修复意见。

提示:12条SQL军规只是结合DWS使用情况来制定的,具有参考价值,给出的规范还需要根据用户使用情况后续进行迭代。

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。