dws集群写入积压
【摘要】 1、kafka decode_m241 topic 生产数据堆积9.6亿,dws写入最高47M;2、监控面板显示磁盘IO、网络IO不在高位瓶颈,白天消费流量44M/S,生产流量50M/s;3、初步判断是flink那边消费可能不够,dws后台io资源偶尔高,大部分时间io资源都比较低4、当前的消费速率和之前白天的消费速率差不多,今天业务积压不是变慢导致的积压,因为昨晚客户业务未及时提交产生的持...
1、kafka decode_m241 topic 生产数据堆积9.6亿,dws写入最高47M;
2、监控面板显示磁盘IO、网络IO不在高位瓶颈,白天消费流量44M/S,生产流量50M/s;
3、初步判断是flink那边消费可能不够,dws后台io资源偶尔高,大部分时间io资源都比较低
4、当前的消费速率和之前白天的消费速率差不多,今天业务积压不是变慢导致的积压,因为昨晚业务未及时提交产生的持续
间断性有idle transaction的问题,导致该时段数据未消费完,出现积压。
5、当前DWS侧IO/CPU未到瓶颈,FLINK侧有流量瓶颈,无法提升生产效率,flink在和客户讨论对kafa扩容,提升生产效率,然后
观察DWS侧消费速度
7、flink已扩容完成,整改增加分区+链路,提升flink侧消费速度;
8、DWS入库积压问题TAM发起kafa+flink+dws联合攻关,flink侧协助客户修改keyby字段和window时间后,消费速度已达到客户预期
9、flink扩容+整改分区后,积压未消除,问题处理时间长,TAM发起flink+dws联合攻关,DWS侧无瓶颈,flink侧协助修改keyby字段和优化window时间后,消费速度已达到预期
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)