如何使用云数据库GaussDB管理平台进行实例安装?

举报
Gauss松鼠会小助手 发表于 2024/01/09 10:19:25 2024/01/09
【摘要】 随着数字经济的蓬勃发展,数据库也成为企业的关键技术生产力,也是各行各业数字化转型的必要根基。GaussDB作为新一代分布式数据库,核心代码100%自主创新,具备高可用、高安全、高性能、高弹性、高智能、易部署、易迁移的特性,是当前国内唯一能够做到软硬协同、全栈自主的数据库,目前已广泛应用于各种场景。本篇将带领大家使用云数据库GaussDB管理平台进行GaussDB实例安装。

本篇将带领大家使用云数据库GaussDB管理平台进行GaussDB实例安装。主要包括从主机上线->实例安装->安装后置检查。

一、准备环境

在开始部署之前,请确保您的服务器满足以下要求:
网络要求

  • 10/25GE 以上以太网
  • 环境要求有3个可用IP
  • 建议网卡设置为双网卡冗余bond,请参考硬件)商的手册或互联网上的方法进行配置。
  • 数据库网络如果配置bond,请保证bond模式一致不一致的 bond 配置可能导致数据库工作异常。

内存

  • 功能调试建议64GB以上
  • 性能测试和商业部署时,DN单实例部署,建议
  • 128GB以上。复杂的查询对内存的需求量比较高在高并发场景下,可能出现内存不足。此时建议使用大内存的机器,或使用负载管理限制系统的并发。

CPU

  • 功能调试最小1x8 核 2.0GHZ。
  • 性能测试和商业部署时,DN单实例部署,建议1x16核2.0GHz。CPU超线程和非超线程两种模式都支持。但是,数据库各节点的设置需保持一致。

硬盘

  • 用于安装数据库的硬盘需最少满足如下要求
  • 至少1GB用于安装数据库的应用程序包
  • 每个主机需大约300MB用于元数据存储
  • 预留70%以上的磁盘剩余空间用于数据存储
  • 建议系统盘配置为Raid1。

当前自动安装实例会将除系统盘外的磁盘都认为是数据盘,并配置为Raid10。有关Raid的配置方法请参考硬件厂家的手册或互联网上的方法进行配置,其中 Disk Cache Policy一项需要设置为Disabled,否则机器异常掉电后 有数据丢失的风险GaussDB支持使用SSD盘作为数据库的主存储设备,支持SAS接口和NVME协议的SSD盘,以RAID的方式部署使用。

二、实例安装流程

1)主机上线

进入“数据中心管理”页面,选择主机所在机房,然后点击“添加主机”。
主机上线时,会安装管理平台的 base agent 用于后续主机标准化检查和升级操作。
image.png

image.png

主机上线完成后,可到对应机房查看主机状态。

  • 初始化完成-上线完成待安装
  • 使用中 -已经被使用

2)执行安装

进入“安装实例”界面,选择参数和规格。
image.png

填写数据库配置信息
image.png

确认实例信息。
image.png

注:如果需要重新选择实例规格,单击“上一步”,回到上个页面修改实例信息。

如果规格确认无误,单击“提交”,完成创建实例的申请。

实例安装比较耗时,可在任务详情页查看创建进度。
image.png

在“实例管理”页面对创建成功的实例进行查看和管理。
image.png

三、软件环境检查

目前要求的操作系统类型是麒麟、统信X86,要求文件系统为ext4。

系统
麒麟 版本要求
Kylin-Server-10-SP1-Release-Build20--aarch64
Kylin-Server-10-SP1-Release-Build20-
-x86_64
Kylin-Server-10-SP2-aarch64-Release-Build09-*
Kylin-Server-10-SP2-x86-Release-Build09-*
统信 版本要求
uniontechos-server-20-*-amd64

操作系统和文件系统配置检查和设置

操作系统参数

  • net.ipv4.tcp max tw buckets
    要求同时保持TIME WAIT状态的TCP/IP连接最大数量为10000
  • net.ipv4.tcp tw reuse
    要求TIME-WAIT状态的sockets重新用于新的TCP连接,1表示启用
  • kernel.sem
    内核信号量参数设置大小为250 6400000 100025600
  • vm.extfrag threshold
    系统内存不够用时,linux会为当前系统内存碎片情况打分,如果超过vm.extfrag threshold的值,kswapd就会触发memory compaction。要求该值设置为500。

文件系统参数

  • 软限制(用户使用的文件柄数量,超出则报告警) 1000000
  • 硬限制(用户使用的文件句柄数量,超过则报错) 1000000
  • 线程池堆栈大小 推荐线程池大小为3072

四、实例安装原理

GaussDB 数据库使用adaptor 接口方式的安装,在adaptor、om-agent安装完成后,会调用adaptor 接口来执行实例的预安装和安装。

安装om-agent

准备好安装om-agent的工作后,就可以执行om-agent的安装

  • 切换到实例用户
    以Ruby用户为例,命令为”su - Ruby
  • 安装om-agent
    python3 /opt/software/gaussdb/agent/mgr/install.py
    其中,/opt/software/gaussdb路径为om-agent包的解压路径
  • 检查是否安装成功
    执行ps ux命令查看om_agent.py进程是否存在,om_agent.py进程存在则表示安装成功;若不存在,请查看安装日志来定位
    image.png

预安装、安装
预安装、安装由上层组装ison体,通过调用adaptor接口来实现。

预安装的目的是在实例安装前完成实例的环境配置,以保证实例安装的正常进行,预安装的 adaptor 接名称为 pre install,预安装需要在待安装实例的所有节点上以实例用户身份来执行。预安装完成后,就可以进行实例的安装了。实例安装的 adaptor 接口名称为 instal,只需以实例用户身份在实例任一个节点上执行即可。

adaptor 接口调用格式都是一致的,如下面所示
echo “param1”:“param1_value”…“func name”:“name”ypython3/XX/adaptor/om controller

其中param1,param2…paramn可以有多个,但必须有func name这个参数,表示要调用adaptor哪个接口最后的om controller 是adaptor可执行文件的路径

执行完毕后,若回显中retcode为0,表示安装成功
image.png

五、安装失败问题定位

1、复制实例ID
image.png

2、查找任务详情
image.png

3、进入“任务中心”,可以查看失败的任务和失败的原因
在本例中失败原因为install om agent failed,需要进一步登录后台查看
image.png

image.png

4、进入后台查看日志,asyncJobResult.dat日志
image.png

5、Agent.log日志
image.png

6、查看内核om agent运行日志,定位到问题根因为创建CA证书失败,权限不足
image.png

实例安装失败定位流程:

  1. 查看任务流失败原因
    在管控平台的工作流中查看安装失败的洋烟原因记录下失败任务ID
  2. asyncJobResult.dat日志
    后台登录到失败节点上,查看asyncJobResult.dat日志中失败任务执行情况
  3. agent.log日志
    查看管控agent运行日志,按失败任务ID来搜索日志详情
  4. 内核运行日志
    若定位到是内核组件运行问题,则进一步查看内核运行日志

本篇由Gauss松鼠会小助手整理
参考学习视频详情见:https://mp.weixin.qq.com/s/901zYO0KG_krVJsMM7dt1A

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

举报
请填写举报理由
0/200