云数据库GaussDB管理平台智能运维新特性亮点速递
Part 01 云数据库GaussDB管理平台智能运维介绍
GaussDB智能运维作为GaussDB运维管理平台中的一个重要组成部分,为运维人员提供问题的快速发现、分析定位、调优和应急恢复能力。为了进一步优化客户体验,提升运维效率,GaussDB智能运维在新版本中新增了自定义巡检、资源下钻分析、日志抓取等新功能,对SQL诊断优化、会话管理等功能做了进一步的完善和体验升级。
Part 02 云数据库GaussDB管理平台智能运维新特性
巡检升级,支持灵活定制巡检配置
运维人员可以通过巡检对单实例或批量实例关键指标等信息进行检查,来实现实例升级前的预检查或对实例健康状态的日常例行检查,从而快速发现实例的潜在问题,提升运维效率。
01 支持巡检任务的统一管理和灵活定制
- 统一管理
支持通过巡检任务管理,查看已经创建的巡检任务或巡检任务执行历史情况,包括执行的状态,执行的耗时等。

- 批量巡检
支持在创建巡检任务时,针对系统中的多个实例进行批量巡检,从而提升运维效率。
- 巡检任务灵活配置
可以通过选择“基于巡检模板创建”,来实现巡检任务的快速创建,也可以基于具体的巡检项对巡检任务进行单独配置。
多维巡检报告展示
可以从任务视角整体分析任务的执行情况,包括任务执行结果概览、任务的异常项等,也可以从实例视角对单个实例的巡检结果做针对性分析。


02 可复用巡检模板,提高巡检任务创建效率
巡检模板自定义:运维人员可以通过系统自带的巡检模板快速创建巡检任务,也可以根据需要自行创建巡检模板,包括自定义附加信息、巡检执行策略、巡检项以及巡检项阈值等,并基于自定义的巡检模板创建巡检任务,提升巡检任务的创建效率。


03 巡检项统一管理,快速查询和修改巡检项默认阈值
运维人员可以通过巡检项管理,了解当前已经支持的所有巡检项,并根据实际需要修改巡检项全局默认阈值。

会话管理升级,全面提升功能体验
运维人员可以在系统资源冲高、业务响应变慢等异常场景下,通过会话管理对实时会话进行异常排查,发现会话执行慢SQL、阻塞会话、执行占用内存高等潜在的异常会话,并提供相应的调优手段,包括SQL Patch、会话查杀、限流等。
01 实时会话监控调优
丰富的查询条件及快速调优
可以根据不同的查询条件定位不同类型的异常,如通过SQL执行时间列排查会话执行的慢SQL,通过内存列排查内存占用高的会话等。
当确定异常会话时,可以对实时会话进行SQL限流,SQL Patch以及查杀动作。
大事务长事务自动查杀
可以通过配置对长事务和大事务进行自动持续查杀,保障实例的稳定性。
02 多维度实时会话统计
可以通过多维度实时会话统计快速掌握当前实例的整体负载情况。
03 历史会话分析
可以通过历史会话分析,查看实例在过去一段时间内等待事件的整体趋势以及TOP SQL信息。


慢SQL升级,支持一站式诊断调优
运维人员可以通过慢SQL诊断,对慢SQL进行一站式的采集分析和调优动作。
01 慢SQL一站式调优
慢SQL持久化
用户可根据业务需求对慢SQL进行持久化转储,保证在实例重启等异常发生时,慢SQL不丢失。

慢SQL统计
从总耗时、平均耗时等多维度观察分析慢SQL执行情况。

慢SQL详情
通过慢SQL详情页,查看慢SQL的完整信息,并提供慢SQL分析诊断调优手段,如:根因分析、索引推荐、SQL Patch、限流、执行计划绑定等。

02 实例Patch统一管理
SQL Patch统一管理
运维人员可以通过SQL Patch管理查看不同SQL已经创建的SQL Patch信息。
Core Dump自动阻断
通过开启该功能来防止由于SQL引起的CoreDump。

新增资源下钻,支持异常资源定位
运维人员可以通过资源下钻功能在节点资源冲高时对节点的CPU、Mem、IO和网络端口进行资源占用分析,快速发现占用异常的进程或者线程信息。
CPU资源分析
通过节点CPU分析查看节点整体CPU使用、TOP CPU进程占用,以及GaussDB进程TOP CPU占用的工作线程和后台线程,排查是否存在CPU异常占用的进程或者线程。

Mem资源分析
通过节点Mem分析查看节点整体Mem使用,TOP Mem占用进程,以及GaussDB进程不同上下文和线程Mem占用情况,排查是否存在Mem异常占用进程或者线程

IO资源分析
可以通过节点IO分析查看节点磁盘IO使用情况、TOP IO占用进程,以及GaussDB进程TOP IO占用的工作线程和后台线程,排查是否存在IO异常占用的进程或者线程。

网络资源分析
可以通过网络接口分析查看节点上网络接口的流量情况,排查网络接口是否存在流量异常。

新增日志抓取,提升问题定位效率
当发生异常,需要定位GaussDB相关组件的运行日志时,运维人员可以通过日志持久化在页面直接下载已经转储的日志文件,或通过在页面上实时浏览方式查找需要的日志文件并进行采集下载。
按需开启转储
通过开启日志转储,可以在异常发生时在页面直接下载需要的日志文件进行问题定位。


实时浏览采集
可以在异常发生时实时浏览节点上的日志目录并对目录下的日志文件进行实时采集下载。

本次云数据库GaussDB管理平台智能运维升级的新特性,在巡检、异常分析、诊断调优等多个方面做了进一步的能力增强,将给运维人员带来更好的使用体验,进一步提升运维效率,欢迎大家在华为Support网站下载体验。
- 点赞
- 收藏
- 关注作者

评论(0)