从零开始实施推荐系统的落地部署——13.推荐系统案例(三)supervisor和kafka安装出现的问题和解决方法

举报
wuyicom 发表于 2020/09/10 03:00:33 2020/09/10
【摘要】 1. 用户日志如何收集,配置flume,通过flume将业务数据服务器mas1的日志收集到hadoop服务器hdfs的hive中。通过向userClick.log数据进行测试安装Supervisor,出现无法在线安装。使用离线。先下载下来,再安装。启动脚本:2. 配置kafka 参照https://www.cnblogs.com/Dev0ps/p/11259324.h...

1.       用户日志如何收集,配置flume,通过flume将业务数据服务器mas1的日志收集到hadoop服务器hdfshive中。通过向userClick.log数据进行测试

blob.png

blob.png

安装Supervisor,出现无法在线安装。使用离线。先下载下来,再安装。

blob.png

启动脚本:

2.       配置kafka 参照https://www.cnblogs.com/Dev0ps/p/11259324.html

blob.png

blob.png

{}中括号去掉:

blob.png

blob.png

之前少写了一句limits:

blob.png

但是有出现问题pod/kafka-zookeeper-0pod/kafka-zookeeper-1pod/kafka-zookeeper-2能运行,但是pod/kafka-0显示pending状态。原因是storageclass的存储容量不够。之前是分配的是150Ggfs-heketi使用replicate:3,导致mysqlha设置3个节点,每个节点10G,共占用90Gkafkazookeeper分别设置10G5G。都是3个节点。在加上gfs-heketi使用replicate:3是(10+5*3*3=135G。想重新构建一个gfs-kafka, replicate:1。但是无法启动kafkazookeeper

blob.png

现在有三个解决方法:

1.       kafkazookeeper重新建立pv,pvc

2.       重新分配给gfs-heketi更大的存储空间。但是hivemysqlha等要重新搭建。

3.       使用Kafka分布式集群部署


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。