GaussDB(DWS)跨集群互联互通资源使用分析

举报
yd_293052510 发表于 2025/06/22 11:04:12 2025/06/22
【摘要】 介绍GaussDB(DWS)互联互通架构和资源使用情况,并重点分析跨AZ/region网络带宽

一、使用场景

GaussDB(DWS)互联互通功能通过GDS进行数据中转,实现多个集群之间的数据同步。主要有两个使用场景:

  1. 使用GDS互联互通功能实现数据同步,可参考:https://support.huaweicloud.com/migration-dws/dws_15_0041.html
  2. 使用GDS互联互通功能实现集群间数据迁移,可参考:https://support.huaweicloud.com/bestpractice-dws/dws_05_0111.html

本文主要对互联互通使用资源情况进行简单分析总结。

二、架构介绍

互联互通的架构如下图所示:

  1. 互联互通同时支持PULL模式和PUSH模式;
  2. 通过2个工作线程和管道实现两个集群之间的互联互通;
  3. GDS启动命令:gds -d dir -p ip:port -H address_string -l log_file -D -t worker_num,其中worker_num/2是可以同时并行运行的管道数量;
  4. 源集群和目标集群都是DN直接连接GDS,以提升性能。数据传输到目标集群后,再进行DN间数据shuffle操作;
  5. 提供传输压缩功能,源集群数据压缩,目标集群数据解压,以降低传输过程中网络带宽的开销。

三、资源分析

1、网络资源分析

在真实使用场景中,两个集群经常在两个不同的AZ或者region中,跨AZ/region网络资源较为紧张,所以本节重点分析网络资源的使用情况。

下图对网络带宽使用情况进行分析:

  1. 节点的recv流量:其他节点DN发往该节点GDS的数据(下图中1)+ 本节点DN发往本节点GDS的数据(下图中2);
  2. 节点的send流量:本节点DN发往本节点GDS的数据(同下图中2)+ 本节点DN发往其他GDS的数据(下图中3)+ 发往目标集群的数据(下图中4);
  3. 由于源集群发往GDS的数据量等于GDS发往目标集群的数据量,所以跨AZ/region带宽(下图中4带宽)=下图中1带宽 + 下图2中带宽;
  4. 通过sar监控可以获得每个节点网络recv和send流量,如下表所示。从而可以估算整个互联互通跨AZ/region的带宽,跨AZ/region的带宽 = 638400kB/s = 4.87gb/s;假如20个节点部署GDS,互联互通使用的全部跨AZ/region带宽等于4.87gb/s*20=97.4gb/s。
    IFACE rxpck/s txpck/s rxkB/s txkB/s
    bond0 246850.00 315583.00 638400 759600

2、其他资源的使用情况

  1. 开启互联互通snappy压缩后,对比非压缩,网络带宽下降50%~65%;
  2. 在网络带宽是瓶颈的情况下,开启互联互通压缩后,数据导入性能提升2倍~3倍;
  3. 开启互联互通压缩后,源集群和目标集群CPU增加5%~10%;
【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。