云数据库GaussDB管理平台智能运维新特性亮点速递

举报
GaussDB 数据库 发表于 2025/10/27 09:47:21 2025/10/27
【摘要】 Part 01 云数据库GaussDB管理平台智能运维介绍GaussDB智能运维作为GaussDB运维管理平台中的一个重要组成部分,为运维人员提供问题的快速发现、分析定位、调优和应急恢复能力。为了进一步优化客户体验,提升运维效率,GaussDB智能运维在新版本中新增了自定义巡检、资源下钻分析、日志抓取等新功能,对SQL诊断优化、会话管理等功能做了进一步的完善和体验升级。Part 02 云数据...

Part 01 云数据库GaussDB管理平台智能运维介绍

GaussDB智能运维作为GaussDB运维管理平台中的一个重要组成部分,为运维人员提供问题的快速发现、分析定位、调优和应急恢复能力。为了进一步优化客户体验,提升运维效率,GaussDB智能运维在新版本中新增了自定义巡检、资源下钻分析、日志抓取等新功能,对SQL诊断优化、会话管理等功能做了进一步的完善和体验升级。

Part 02 云数据库GaussDB管理平台智能运维新特性

巡检升级,支持灵活定制巡检配置

运维人员可以通过巡检对单实例或批量实例关键指标等信息进行检查,来实现实例升级前的预检查或对实例健康状态的日常例行检查,从而快速发现实例的潜在问题,提升运维效率。

01 支持巡检任务的统一管理和灵活定制

  • 统一管理

支持通过巡检任务管理,查看已经创建的巡检任务或巡检任务执行历史情况,包括执行的状态,执行的耗时等。


1.png

  • 批量巡检 

支持在创建巡检任务时,针对系统中的多个实例进行批量巡检,从而提升运维效率。

  • 巡检任务灵活配

可以通过选择“基于巡检模板创建”,来实现巡检任务的快速创建,也可以基于具体的巡检项对巡检任务进行单独配置。

  • 2.png多维巡检报告展示

可以从任务视角整体分析任务的执行情况,包括任务执行结果概览、任务的异常项等,也可以从实例视角对单个实例的巡检结果做针对性分析。

3.png

4.png

02 可复用巡检模板,提高巡检任务创建效率

巡检模板自定义:运维人员可以通过系统自带的巡检模板快速创建巡检任务,也可以根据需要自行创建巡检模板,包括自定义附加信息、巡检执行策略、巡检项以及巡检项阈值等,并基于自定义的巡检模板创建巡检任务,提升巡检任务的创建效率。

6.png5.png

03 巡检项统一管理,快速查询和修改巡检项默认阈值

运维人员可以通过巡检项管理,了解当前已经支持的所有巡检项,并根据实际需要修改巡检项全局默认阈值。

7.png

会话管理升级,全面提升功能体验

运维人员可以在系统资源冲高、业务响应变慢等异常场景下,通过会话管理对实时会话进行异常排查,发现会话执行慢SQL、阻塞会话、执行占用内存高等潜在的异常会话,并提供相应的调优手段,包括SQL Patch、会话查杀、限流等。

01 实时会话监控调优

丰富的查询条件及快速调优

可以根据不同的查询条件定位不同类型的异常,如通过SQL执行时间列排查会话执行的慢SQL,通过内存列排查内存占用高的会话等。

当确定异常会话时,可以对实时会话进行SQL限流,SQL Patch以及查杀动作。

9.png大事务长事务自动查杀

可以通过配置对长事务和大事务进行自动持续查杀,保障实例的稳定性。

10.png02 多维度实时会话统计 

可以通过多维度实时会话统计快速掌握当前实例的整体负载情况。

11.png03 历史会话分析

可以通过历史会话分析,查看实例在过去一段时间内等待事件的整体趋势以及TOP SQL信息。

12.png

13.png

慢SQL升级,支持一站式诊断调优

运维人可以通过慢SQL诊断,对慢SQL进行一站式的采集分析和调优动作。

01 慢SQL一站式调优

慢SQL持久化

用户可根据业务需求对慢SQL进行持久化转储,保证在实例重启等异常发生时,慢SQL不丢失。

14.png

慢SQL统计

从总耗时、平均耗时等多维度观察分析慢SQL执行情况。

15.png

慢SQL详情

通过慢SQL详情页,查看慢SQL的完整信息,并提供慢SQL分析诊断调优手段,如:根因分析、索引推荐、SQL Patch、限流、执行计划绑定等。

16.png

02 实例Patch统一管理

SQL Patch统一管理

运维人员可以通过SQL Patch管理查看不同SQL已经创建的SQL Patch信息。

17.pngCore Dump自动阻断

通过开启该功能来防止由于SQL引起的CoreDump

18.png

新增资源下钻,支持异常资源定位

运维人员可以通过资源下钻功能在节点资源冲高时对节点的CPUMemIO和网络端口进行资源占用分析,快速发现占用异常的进程或者线程信息。

CPU资源分析

通过节点CPU分析查看节点整体CPU使用、TOP CPU进程占用,以及GaussDB进程TOP CPU占用的工作线程和后台线程,排查是否存在CPU异常占用的进程或者线程。

19.png

Mem资源分析

通过节点Mem分析查看节点整体Mem使用,TOP Mem占用进程,以及GaussDB进程不同上下文和线程Mem占用情况,排查是否存在Mem异常占用进程或者线程

20.png

IO资源分析

可以通过节点IO分析查看节点磁盘IO使用情况、TOP IO占用进程,以及GaussDB进程TOP IO占用的工作线程和后台线程,排查是否存在IO异常占用的进程或者线程。

21.png

网络资源分析

可以通过网络接口分析查看节点上网络接口的流量情况,排查网络接口是否存在流量异常。

22.png

新增日志抓取,提升问题定位效率

当发生异常,需要定位GaussDB相关组件的运行日志时,运维人员可以通过日志持久化在页面直接下载已经转储的日志文件,或通过在页面上实时浏览方式查找需要的日志文件并进行采集下载。

按需开启转储

通过开启日志转储,可以在异常发生时在页面直接下载需要的日志文件进行问题定位。

23.png

24.png

实时浏览采集

可以在异常发生时实时浏览节点上的日志目录并对目录下的日志文件进行实时采集下载。

26.png

本次云数据库GaussDB管理平台智能运维升级的新特性,在巡检、异常分析、诊断调优等多个方面做了进一步的能力增强,将给运维人员带来更好的使用体验,进一步提升运维效率,欢迎大家在华为Support网站下载体验。

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。