Hadoop CDH部署指南

举报
Ben_5003 发表于 2019/05/17 13:56:59 2019/05/17
【摘要】 一、集群环境信息本次安装集群共5台主机,其中一台CM管理节点,2台namonode节点,2台datanode节点。具体信息如下: 主机名IP地址集群角色主机配置操作系统版本cm192.168.0.128CM manager4C/16GCentos 6.8namenode1192.168.0.121namonode4C/16GCentos 6.8namenode2192.168.0...

一、集群环境信息

本次安装集群共5台主机,其中一台CM管理节点,2台namonode节点,2台datanode节点。具体信息如下:

 

主机名

IP地址

集群角色

主机配置

操作系统版本

cm

192.168.0.128

CM   manager

4C/16G

Centos   6.8

namenode1

192.168.0.121

namonode

4C/16G

Centos   6.8

namenode2

192.168.0.122

namonode

4C/16G

Centos   6.8

datanode1

192.168.0.123

datanode

4C/8G

Centos   6.8

datanode2

192.168.0.124

datanode

4C/8G

Centos   6.8

 

二、安装前准备

1.设置/etc/hosts文件(CDH集群内所有主机都要配置)

cat >> /etc/hosts << EOF

192.168.0.128   cm

192.168.0.121   namenode1

192.168.0.122   namenode2

192.168.0.123   datanode1

192.168.0.124   datanode2

EOF

 

172.31.28.51   cm

172.31.28.52   namenode1

172.31.28.53   namenode2

172.31.28.54   datanode1

172.31.28.55   datanode2

 

2.修改主机ulimit配置

cat >>  /etc/security/limits.conf << EOF

 

########### limits for Hadoop #############

*         soft    nproc   131072

*         hard    nproc   131072

*         soft    nofile  655360

*         hard    nofile  655360

########### limits for Hadoop #############

 

 

EOF

3.禁用selinux(CDH集群内所有主机都要配置)

即时禁用:setenforce 0

开机禁用:修改/etc/selinux/config文件,SELINUX值为disabled

spacer.gif

4.关闭防火墙(CDH集群内所有主机都要配置)

即时关闭:service iptables stop

          service ip6tables stop

开机关闭:chkconfig iptables off

          chkconfig ip6tables off

spacer.gif

spacer.gif

 

 

5.修改主机参数交换区和透明大页面参数(CDH集群内所有主机都要配置)

配置即时生效:

echo 0 > /proc/sys/vm/swappiness

echo never > /sys/kernel/mm/transparent_hugepage/defrag

echo never > /sys/kernel/mm/transparent_hugepage/enabled

 

配置重启生效:

修改/etc/sysctl.conf文件

vm.swappiness=0

 

修改/etc/rc.d/rc.local文件

增加以下内容

echo never > /sys/kernel/mm/transparent_hugepage/defrag

echo never > /sys/kernel/mm/transparent_hugepage/enabled

 

6.集群时钟同步(CDH集群内所有主机都要配置)

配置时间同步服务器

修改/etc/ntp.conf文件,

server=192.168.1.220

spacer.gif

修改/etc/sysconfig/ntpdate文件

SYNC_HWCLOCK=yes

spacer.gif

 

启动ntpd服务

service ntpd start

spacer.gif

 

 

7.安装httpd(CM主机执行)

yum install httpd

 

spacer.gif

启动httpd服务

spacer.gif

 

配置CM/CDH安装文件httpd服务(CM主机执行)

新建httpd子目录

mkdir –p /var/www/html/CDH

mkdir –p /var/www/html/CM

 

进入CDH目录

cd /var/www/html/CDH

wget http://archive.cloudera.com/cdh5/parcels/5.11.0/CDH-5.11.0-1.cdh5.11.0.p0.34-el6.parcel

wget http://archive.cloudera.com/cdh5/parcels/5.11.0/CDH-5.11.0-1.cdh5.11.0.p0.34-el6.parcel.sha1

wget http://archive.cloudera.com/cdh5/parcels/5.11.0/manifest.json

注意:下载的sha1文件后缀要改成sha,否则CM无法认出

mv CDH-5.11.0-1.cdh5.11.0.p0.34-el6.parcel.sha1 CDH-5.11.0-1.cdh5.11.0.p0.34-el6.parcel.sha

 

进入CM目录

cd /var/www/html/CM

wget http://archive.cloudera.com/cm5/repo-as-tarball/5.11.0/cm5.11.0-centos6.tar.gz

tar xvf cm5.11.0-centos6.tar.gz

 

8.配置内网CM YUM源(CDH集群内所有主机都要配置)

cat > /etc/yum.repos.d/cm.repo << EOF

[CM]

name=CM

baseurl=http://192.168.0.128/CM/cm/5.11.0/

gpgcheck=0

enabled=1

EOF

spacer.gif

9.安装mariadb(CM节点安装)

安装mariadb 10.1

下载:

http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/galera-25.3.20-1.rhel6.el6.x86_64.rpm

http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/jemalloc-3.6.0-1.el6.x86_64.rpm

http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/jemalloc-devel-3.6.0-1.el6.x86_64.rpm

http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/MariaDB-10.1.25-centos6-x86_64-client.rpm

http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/MariaDB-10.1.25-centos6-x86_64-server.rpm

http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/MariaDB-10.1.25-centos6-x86_64-shared.rpm

http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/MariaDB-10.1.25-centos6-x86_64-common.rpm

http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/ MariaDB-10.1.25-centos6-x86_64-compat.rpm

 

https://downloads.mariadb.com/MariaDB/mariadb-galera-5.5.56/galera-25.3.20/rpm/galera-25.3.20-1.rhel6.el6.x86_64.rpm

 

https://downloads.mariadb.com/MariaDB/mariadb-galera-5.5.56/galera-25.3.20/rpm/jemalloc-3.6.0-1.el6.x86_64.rpm

 

 

 

安装:

yum localinstall galera-25.3.20-1.rhel6.el6.x86_64.rpm jemalloc-3.6.0-1.el6.x86_64.rpm jemalloc-devel-3.6.0-1.el6.x86_64.rpm MariaDB-10.1.25-centos6-x86_64-client.rpm MariaDB-10.1.25-centos6-x86_64-server.rpm MariaDB-10.1.25-centos6-x86_64-shared.rpm MariaDB-10.1.25-centos6-x86_64-common.rpm MariaDB-10.1.25-centos6-x86_64-compat.rpm

 

配置mysql

修改/etc/my.cnf.d/server.cnf

[mysqld]项目下增加

character-set-server=utf8

lower_case_table_names=1

 

启动mariadb

service mysql start

spacer.gif

 

 

 

9.安装mysql connect jdbc jar包(所有主机都要安装)

wget https://cdn.mysql.com//Downloads/Connector-J/mysql-connector-java-5.1.43.tar.gz

mkdir –p /usr/share/java

tar xvf mysql-connector-java-5.1.43.tar.gz

cp mysql-connector-java-5.1.43/mysql-connector-java-5.1.43-bin.jar /usr/share/java/mysql-connector-java.jar

 

三、CM/CDH安装

1.CM主机安装cm server和jdk

yum -y install cloudera-manager-server.x86_64 cloudera-manager-server-db-2.x86_64 cloudera-manager-daemons.x86_64

yum -y install oracle-j2sdk1.7.x86_64

 

2.mariadb建立cm server元数据库,并赋权给scm用户

create database cm;

grant all on cm.* to scm@’localhost’ identified by ’scm’;

flush privileges;

 

3. mariadb建立CM监控组件数据库并赋权

 

create database amon;

create database rman;

 

grant all on amon.* to amon@'localhost' identified by amon;

grant all on amon.* to amon@’cm identified by ’amon’;

grant all on rman.* to rman@’cm identified by ’rman’;

flush privileges;

 

amonactive monitor组件数据库

rmanreport manager组件数据库

 

MySQL [(none)]> grant all on amon.* to amon@'jc5w0gmrrep8u6.clchyxjwtayu.rds.cn-northwest-1.amazonaws.com.cn' identified by 'amon';

 

grant all on amon.* to amon@cm’ identified by 'amon';

4. mariadb建立CDH组件数据库并赋权

create database hive;

create database oozie;

create database hue;

 

 

 

 

grant all on hive.* to hive@’%’ identified by ‘hive’;

grant all on oozie.* to oozie@’cm’ identified by ‘oozie’;

grant all on hue.* to hue@’%’ identified by ‘hue’;

flush privileges;

5.初始化CM元数据库

CM主机执行如下命令:

 

/usr/share/cmf/schema/scm_prepare_database.sh mysql cm scm scm

 

spacer.gif

 

6.开始安装CM/CDH

 

CM主机启动CM server服务

service cloudera-scm-server start

 

安装后打开页面,安装agent

https://192.168.0.128:7180

输入用户名/密码:admin/admin

 

 

spacer.gif

勾选“是的,我接受最终用户许可条款和条件。”。点击“继续”

spacer.gif

选择“数据集线器试用版”,点击“继续”

spacer.gif

点击“继续”进行下一步

spacer.gif输入加入集群的主机,使用默认端口22,点击“搜索”

spacer.gif

可以看到需要加入集群的主机都可发现,点击继续

 

spacer.gif

配置之前选择的CDH源,点击“更多选项“

spacer.gif

删除所有默认的远程parcel存储库URL,然后点击spacer.gif增加前面配置的源

spacer.gif

然后点击“保存更改“

spacer.gif

选择对应的CDH版本,并自定义Cloudera Manager Agent存储库,点击“继续“

spacer.gif

选中“安装 Oracle Java SE 开发工具包 (JDK)“和”安装 Java 无限制强度加密政策文件“,点击“继续”

spacer.gif

不勾选“单用户模式”,点击“继续”

spacer.gif

选择默认root用户,“所有主机接受相同密码“,然后输入集群内主机密码。

spacer.gif

上图可以看到正在安装。

spacer.gif

完成CM agent安装后点击“继续“

spacer.gif

后面会安装CDH parcel,如上图所示

spacer.gif

完成后点击继续

 

 

spacer.gif

安装程序会检查主机参数是否配置正确,若有验证失败项,根据要求修改后重新运行主机检测,直到正常为止。然后点击“完成“。

spacer.gif

选择自定义服务。

spacer.gif

勾选HDFS,Hive,Hue,Impala,Yarn,Zookeeper,点击“继续“,进行角色分配。

spacer.gif

HDFS部分,NameNode,SecondaryNameNode选择namenode1主机,后面会选择namenode2与现有namenode1做HA

Balancer选择namenode2主机

HttpFS,NFS Gateway留空

DataNode选择datanode1,datanode2

 

spacer.gif

Hive部分,Gateway选择所有主机

Hive Metastore Server,HiveServer2选择namenode1,namenode2主机

WebHCat Server不选择

spacer.gif

Hue部分,Hue Server选择 namenode1,namenode2主机

spacer.gif

Impala部分,Impala Catalog ServerImpala StateStore选择namenode1

Impala DaemonDataNode角色主机相同

 

spacer.gif

Cloudera Management Service部分,所有角色都放在cm主机中

spacer.gif

Oozie Server部分,Oozie角色放在cm主机

spacer.gif

YARN部分,ResourceManager选择namenode1,后面会加上namenode2,做HA

JobHistory Server选择namenode2

NodeManagerDataNode角色主机相同

 

spacer.gif

ZooKeeper选择cm,namenode1,namenode2主机

 

spacer.gif

 

选择填入对应的数据库信息,测试连接没问题后继续。

 

spacer.gif

审核更改:选择默认设置,点击“继续“

spacer.gif

完成组件启动后点击“继续”

spacer.gif

 

至此,CDH已经安装完成。

 

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。