GaussDB(DWS) 集群管理(CM)介绍(一)

举报
葡萄 发表于 2021/02/18 17:19:13 2021/02/18
【摘要】 GaussDB(DWS) 集群管理CM工具使用介绍

       GaussDB 是一款shared nothing架构、由多实例节点组成的分布式数据库产品,每一个节点上都分布着不同的实例,包括管理实例、计算实例、调度实例等。不同的节点、实例之间的角色、状态由CM模块进行协调管理。如下图:

                                                 

       CM功能模块包括CMS(Cluster Manager Server)和CMA(Cluster Manager Agent)、CM工具:
                CMS——仲裁实例,集群管理的核心模块,负责包括计算实例(GTM、DN)HA状态、调度实例(CN)的存活度仲裁和动作命令的下发。
                CMA——仲裁代理实例,负责实例状态的监控上报、动作命令执行、告警模块的上报。
                CM工具——集群管理工具,将CM管理能力转换为主动下发的一组命令工具。
       下文我们通过CM工具简单介绍下CM模块承载的部分管理功能:

               

        如上图,常用的动作包括start、switchover、build、stop、query、restart、view等。

                  说明:-z、-%arbitration%类参数、-%az%等参数暂时不多赘述,当前华为云发布的产品形态功能不依赖此类参数。

        1.start/stop——集群启停,包括完整集群的启停、节点启停、实例启停;

             cm_ctl stop/start [-n <nodeId>  [-D <datapath>]]  ;stop/start作为启停的必选参数之一,-n、-D 作为可选分别对应节点、实例级启停,如果启停实例则必须z指定-n节点编号。

             

            如上图:可以通过query的方式查出实例的编号、节点、路径、状态等信息;停止第2个节点的CN实例cm_ctl stop -n 2 -D /data2/data/coordinator.

           

      2.query ——集群信息查询,包括集群的静态信息、状态信息、关系节点信息

             cm_ctl query  [-v [-C [-s] [-d] [-i] [-F] [-L ALL] [-x] [-p] [P] ]] [[-n NODEID] [-D DATADIR] [-R]];query作为查询的必选参数之一,-n、-D、-R 作为查询实例的接口参数,需要一起使用,分开使用的意义不大;其余参数可单独使用,其中-v参数作为查询集群状态的基础信息最好和-C参数一起使用,可以更容易看出集群结构和实例的HA关系。   

             查看集群的整体状态信息:

           

           查询与指定节点、实例相关的实例信息:

         

            [-v [-C [-s] [-d] [-i] [-F] [-L ALL] [-x] [-p] [P] ]]:

            -v 可以查询到集群所有实例的详细主备信息,包括HA同步状态、同步位置等信息,在不带-C的情况下未进行信息的过滤和格式化。

            -s 可以查询到发生switchover 实例组

           

           -F 查询JAVA UDF实例进程状态

           

           -x 显示状态异常实例

           

           -p 显示实例对应的端口号

           

           -P 显示实例在OS重的PID

           

      3.switchover——主备切换,主要针对集群中存在主备关系的实例角色进行切换;

            cm_ctl switchover [-n NODEID -D DATADIR [-q]] [-a [-q]],主备切换主要分两种一种实例级切换,一种集群级切换(集群均衡状态恢复)。

            实例切换,主要针对实例级别的主备关系切换,cm_ctl switchover -n <nodeId> -D <datapath>;

           

            cm_ctl switchover -a 恢复集群所有非初始化均衡状态实例。

           

      4. build——重建实例数据,重建实例要求被重建实例能够被拉起(即参数文件postgresql.conf存在),通过保持HA关系的Primary实例恢复备机实例数据;

             cm_ctl build -n NODEID -D DATADIR [-b BUILD_MODE] , build只能针对实例级别进行重建,-b表示全量重建。

             

             说明:该功能重点是重建实例下的数据文件,并不能完全重建实例目录下所有的文件,因此在实例故障情况下,建议用OM模块gs_replace接口进行修复。

      5. retsart——重启接口,该接口只针对逻辑集群功能,当一个物理集群中包含逻辑集群的情况下,可以通过指定逻辑集群名重启逻辑集群。

              cm_ctl restart -L <LCNAME> ;LCNAME可以通过cm_ctl query -Cv -L ALL查询

       本文中主要介绍了CM管理模块中部分功能——CM工具使用方法和基本的功能操作,其中选择了较为通用的命令接口进行介绍,其余接口命令可参考产品详细的帮助信息。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。