巡检工具部署及使用(线上版本gs_check)
1 获取并安装巡检工具
1.1 安装说明
1、此方法适用于所有的线上版本(HCS\HCSO\HC等)。
2、2020.9.30 发布版本,将工具已经集成到了产品的镜像中,新安装环境可以进入沙箱内的/opt/dws/opstool/ 目录下,因此可以不需要安装,进入沙箱中/opt/dws/opstool/目录,直接执行gs_check命令即可;升级上来的集群,因为不会重新安装镜像,所以沙箱内的/opt/dws/opstool/目录无巡检工具,需要自己安装。
3、2021.6.30 发布版本,由于新特性支持更新插件包,升级到此版本后会自动将巡检工具部署到沙箱内的/opt/dws/opstool/ 目录下,因此可以不需要安装,进入沙箱中/opt/dws/opstool/目录,直接执行gs_check命令即可。
1.2 准备巡检工具
线上DWS自带gs_check巡检工具目前因为root互信等原因无法执行巡检,需要手动上传特定版本的gs_check到obs,然后在集群里面下载安装之后进行巡检。
将如下巡检工具上传至目标集群相同region的obs桶,并赋予匿名用户读取权限,并获取到下载链接。具体上传obs步骤可参考产品手册:《上传数据到OBS:https://support.huaweicloud.com/intl/zh-cn/devg-dws/dws_04_0057.html》
1.3 安装巡检工具
登陆进dws集群第一个cn节点,root用户执行wget下载巡检工具、解压、并赋予Ruby用户权限:
cd /var/chroot/DWS/data1 wget https://akctong.obs.cn-east-3.myhuaweicloud.com/8.1.0.101-inspect-e629bad.tar.gz mkdir check tar -xvf 8.1.0.101-inspect-e629bad.tar.gz -C check chown -R Ruby:Ruby check/ |
使用Ruby用户进入沙箱,通过gs_ssh 命令将check目录分发到所有节点。XXX为当前节点的主机名。
su - Ruby ssh hostname cd /DWS/data1 gs_ssh -c "scp -r Ruby@XXX:/DWS/data1/check /DWS/data1/" |
1.4 准备Ruby用户密码
提前解密查好目标集群Ruby用户的密码。(8.1.1.xxx-inspect-xxxxx.tar.gz 版本已经不需要输入Ruby密码)
2 执行巡检
2.1 日常巡检
使用Ruby用户登陆第一个cn节点在沙箱内执行日常巡检
cd /DWS/data1/check ./gs_check -e inspect |
2.2 扩容前巡检
使用Ruby用户登陆第一个cn节点在沙箱内执行扩容前巡检
cd /DWS/data1/check ./gs_check -i CheckCollector ./gs_check -e expand |
2.1 升级前巡检
使用Ruby用户登陆第一个cn节点在沙箱内执行升级前巡检
cd /DWS/data1/check ./gs_check -e upgrade |
每个巡检会在回显中生成类似/var/chroot/DWS/data1/check/inspection/output/CheckReport_202103156286720005.tar.gz的文件,即巡检结果。
想了解GuassDB(DWS)更多信息,欢迎微信搜索“GaussDB DWS”关注微信公众号,和您分享最新最全的PB级数仓黑科技,后台还可获取众多学习资料~
- 点赞
- 收藏
- 关注作者
评论(0)