如何使用云数据库GaussDB管理平台进行实例安装?
本篇将带领大家使用云数据库GaussDB管理平台进行GaussDB实例安装。主要包括从主机上线->实例安装->安装后置检查。
一、准备环境
在开始部署之前,请确保您的服务器满足以下要求:
网络要求
- 10/25GE 以上以太网
- 环境要求有3个可用IP
- 建议网卡设置为双网卡冗余bond,请参考硬件)商的手册或互联网上的方法进行配置。
- 数据库网络如果配置bond,请保证bond模式一致不一致的 bond 配置可能导致数据库工作异常。
内存
- 功能调试建议64GB以上
- 性能测试和商业部署时,DN单实例部署,建议
- 128GB以上。复杂的查询对内存的需求量比较高在高并发场景下,可能出现内存不足。此时建议使用大内存的机器,或使用负载管理限制系统的并发。
CPU
- 功能调试最小1x8 核 2.0GHZ。
- 性能测试和商业部署时,DN单实例部署,建议1x16核2.0GHz。CPU超线程和非超线程两种模式都支持。但是,数据库各节点的设置需保持一致。
硬盘
- 用于安装数据库的硬盘需最少满足如下要求
- 至少1GB用于安装数据库的应用程序包
- 每个主机需大约300MB用于元数据存储
- 预留70%以上的磁盘剩余空间用于数据存储
- 建议系统盘配置为Raid1。
当前自动安装实例会将除系统盘外的磁盘都认为是数据盘,并配置为Raid10。有关Raid的配置方法请参考硬件厂家的手册或互联网上的方法进行配置,其中 Disk Cache Policy一项需要设置为Disabled,否则机器异常掉电后 有数据丢失的风险GaussDB支持使用SSD盘作为数据库的主存储设备,支持SAS接口和NVME协议的SSD盘,以RAID的方式部署使用。
二、实例安装流程
1)主机上线
进入“数据中心管理”页面,选择主机所在机房,然后点击“添加主机”。
主机上线时,会安装管理平台的 base agent 用于后续主机标准化检查和升级操作。
主机上线完成后,可到对应机房查看主机状态。
- 初始化完成-上线完成待安装
- 使用中 -已经被使用
2)执行安装
进入“安装实例”界面,选择参数和规格。
填写数据库配置信息
确认实例信息。
注:如果需要重新选择实例规格,单击“上一步”,回到上个页面修改实例信息。
如果规格确认无误,单击“提交”,完成创建实例的申请。
实例安装比较耗时,可在任务详情页查看创建进度。
在“实例管理”页面对创建成功的实例进行查看和管理。
三、软件环境检查
目前要求的操作系统类型是麒麟、统信X86,要求文件系统为ext4。
系统
麒麟 版本要求
Kylin-Server-10-SP1-Release-Build20--aarch64
Kylin-Server-10-SP1-Release-Build20--x86_64
Kylin-Server-10-SP2-aarch64-Release-Build09-*
Kylin-Server-10-SP2-x86-Release-Build09-*
统信 版本要求
uniontechos-server-20-*-amd64
操作系统和文件系统配置检查和设置
操作系统参数
- net.ipv4.tcp max tw buckets
要求同时保持TIME WAIT状态的TCP/IP连接最大数量为10000 - net.ipv4.tcp tw reuse
要求TIME-WAIT状态的sockets重新用于新的TCP连接,1表示启用 - kernel.sem
内核信号量参数设置大小为250 6400000 100025600 - vm.extfrag threshold
系统内存不够用时,linux会为当前系统内存碎片情况打分,如果超过vm.extfrag threshold的值,kswapd就会触发memory compaction。要求该值设置为500。
文件系统参数
- 软限制(用户使用的文件柄数量,超出则报告警) 1000000
- 硬限制(用户使用的文件句柄数量,超过则报错) 1000000
- 线程池堆栈大小 推荐线程池大小为3072
四、实例安装原理
GaussDB 数据库使用adaptor 接口方式的安装,在adaptor、om-agent安装完成后,会调用adaptor 接口来执行实例的预安装和安装。
安装om-agent
准备好安装om-agent的工作后,就可以执行om-agent的安装
- 切换到实例用户
以Ruby用户为例,命令为”su - Ruby - 安装om-agent
python3 /opt/software/gaussdb/agent/mgr/install.py
其中,/opt/software/gaussdb路径为om-agent包的解压路径 - 检查是否安装成功
执行ps ux命令查看om_agent.py进程是否存在,om_agent.py进程存在则表示安装成功;若不存在,请查看安装日志来定位
预安装、安装
预安装、安装由上层组装ison体,通过调用adaptor接口来实现。
预安装的目的是在实例安装前完成实例的环境配置,以保证实例安装的正常进行,预安装的 adaptor 接名称为 pre install,预安装需要在待安装实例的所有节点上以实例用户身份来执行。预安装完成后,就可以进行实例的安装了。实例安装的 adaptor 接口名称为 instal,只需以实例用户身份在实例任一个节点上执行即可。
adaptor 接口调用格式都是一致的,如下面所示
echo “param1”:“param1_value”…“func name”:“name”ypython3/XX/adaptor/om controller
其中param1,param2…paramn可以有多个,但必须有func name这个参数,表示要调用adaptor哪个接口最后的om controller 是adaptor可执行文件的路径
执行完毕后,若回显中retcode为0,表示安装成功
五、安装失败问题定位
1、复制实例ID
2、查找任务详情
3、进入“任务中心”,可以查看失败的任务和失败的原因
在本例中失败原因为install om agent failed,需要进一步登录后台查看
4、进入后台查看日志,asyncJobResult.dat日志
5、Agent.log日志
6、查看内核om agent运行日志,定位到问题根因为创建CA证书失败,权限不足
实例安装失败定位流程:
- 查看任务流失败原因
在管控平台的工作流中查看安装失败的洋烟原因记录下失败任务ID - asyncJobResult.dat日志
后台登录到失败节点上,查看asyncJobResult.dat日志中失败任务执行情况 - agent.log日志
查看管控agent运行日志,按失败任务ID来搜索日志详情 - 内核运行日志
若定位到是内核组件运行问题,则进一步查看内核运行日志
本篇由Gauss松鼠会小助手整理
参考学习视频详情见:https://mp.weixin.qq.com/s/901zYO0KG_krVJsMM7dt1A
- 点赞
- 收藏
- 关注作者
评论(0)