GaussDB(DWS)跨集群互联互通资源使用分析
【摘要】 介绍GaussDB(DWS)互联互通架构和资源使用情况,并重点分析跨AZ/region网络带宽
一、使用场景
GaussDB(DWS)互联互通功能通过GDS进行数据中转,实现多个集群之间的数据同步。主要有两个使用场景:
- 使用GDS互联互通功能实现数据同步,可参考:https://support.huaweicloud.com/migration-dws/dws_15_0041.html
- 使用GDS互联互通功能实现集群间数据迁移,可参考:https://support.huaweicloud.com/bestpractice-dws/dws_05_0111.html
本文主要对互联互通使用资源情况进行简单分析总结。
二、架构介绍
互联互通的架构如下图所示:
- 互联互通同时支持PULL模式和PUSH模式;
- 通过2个工作线程和管道实现两个集群之间的互联互通;
- GDS启动命令:gds -d dir -p ip:port -H address_string -l log_file -D -t worker_num,其中worker_num/2是可以同时并行运行的管道数量;
- 源集群和目标集群都是DN直接连接GDS,以提升性能。数据传输到目标集群后,再进行DN间数据shuffle操作;
- 提供传输压缩功能,源集群数据压缩,目标集群数据解压,以降低传输过程中网络带宽的开销。
三、资源分析
1、网络资源分析
在真实使用场景中,两个集群经常在两个不同的AZ或者region中,跨AZ/region网络资源较为紧张,所以本节重点分析网络资源的使用情况。
下图对网络带宽使用情况进行分析:
- 节点的recv流量:其他节点DN发往该节点GDS的数据(下图中1)+ 本节点DN发往本节点GDS的数据(下图中2);
- 节点的send流量:本节点DN发往本节点GDS的数据(同下图中2)+ 本节点DN发往其他GDS的数据(下图中3)+ 发往目标集群的数据(下图中4);
- 由于源集群发往GDS的数据量等于GDS发往目标集群的数据量,所以跨AZ/region带宽(下图中4带宽)=下图中1带宽 + 下图2中带宽;
- 通过sar监控可以获得每个节点网络recv和send流量,如下表所示。从而可以估算整个互联互通跨AZ/region的带宽,跨AZ/region的带宽 = 638400kB/s = 4.87gb/s;假如20个节点部署GDS,互联互通使用的全部跨AZ/region带宽等于4.87gb/s*20=97.4gb/s。
IFACE rxpck/s txpck/s rxkB/s txkB/s bond0 246850.00 315583.00 638400 759600
2、其他资源的使用情况
- 开启互联互通snappy压缩后,对比非压缩,网络带宽下降50%~65%;
- 在网络带宽是瓶颈的情况下,开启互联互通压缩后,数据导入性能提升2倍~3倍;
- 开启互联互通压缩后,源集群和目标集群CPU增加5%~10%;
【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)