Hadoop CDH部署指南
一、集群环境信息
本次安装集群共5台主机,其中一台CM管理节点,2台namonode节点,2台datanode节点。具体信息如下:
主机名 | IP地址 | 集群角色 | 主机配置 | 操作系统版本 |
cm | 192.168.0.128 | CM manager | 4C/16G | Centos 6.8 |
namenode1 | 192.168.0.121 | namonode | 4C/16G | Centos 6.8 |
namenode2 | 192.168.0.122 | namonode | 4C/16G | Centos 6.8 |
datanode1 | 192.168.0.123 | datanode | 4C/8G | Centos 6.8 |
datanode2 | 192.168.0.124 | datanode | 4C/8G | Centos 6.8 |
二、安装前准备
1.设置/etc/hosts文件(CDH集群内所有主机都要配置)
cat >> /etc/hosts << EOF
192.168.0.128 cm
192.168.0.121 namenode1
192.168.0.122 namenode2
192.168.0.123 datanode1
192.168.0.124 datanode2
EOF
172.31.28.51 cm
172.31.28.52 namenode1
172.31.28.53 namenode2
172.31.28.54 datanode1
172.31.28.55 datanode2
2.修改主机ulimit配置
cat >> /etc/security/limits.conf << EOF
########### limits for Hadoop #############
* soft nproc 131072
* hard nproc 131072
* soft nofile 655360
* hard nofile 655360
########### limits for Hadoop #############
EOF
3.禁用selinux(CDH集群内所有主机都要配置)
即时禁用:setenforce 0
开机禁用:修改/etc/selinux/config文件,SELINUX值为disabled
4.关闭防火墙(CDH集群内所有主机都要配置)
即时关闭:service iptables stop
service ip6tables stop
开机关闭:chkconfig iptables off
chkconfig ip6tables off
5.修改主机参数交换区和透明大页面参数(CDH集群内所有主机都要配置)
配置即时生效:
echo 0 > /proc/sys/vm/swappiness
echo never > /sys/kernel/mm/transparent_hugepage/defrag
echo never > /sys/kernel/mm/transparent_hugepage/enabled
配置重启生效:
修改/etc/sysctl.conf文件
vm.swappiness=0
修改/etc/rc.d/rc.local文件
增加以下内容
echo never > /sys/kernel/mm/transparent_hugepage/defrag
echo never > /sys/kernel/mm/transparent_hugepage/enabled
6.集群时钟同步(CDH集群内所有主机都要配置)
配置时间同步服务器
修改/etc/ntp.conf文件,
server=192.168.1.220
修改/etc/sysconfig/ntpdate文件
SYNC_HWCLOCK=yes
启动ntpd服务
service ntpd start
7.安装httpd(CM主机执行)
yum install httpd
启动httpd服务
配置CM/CDH安装文件httpd服务(CM主机执行)
新建httpd子目录
mkdir –p /var/www/html/CM
cd /var/www/html/CDH
wget http://archive.cloudera.com/cdh5/parcels/5.11.0/CDH-5.11.0-1.cdh5.11.0.p0.34-el6.parcel
wget http://archive.cloudera.com/cdh5/parcels/5.11.0/CDH-5.11.0-1.cdh5.11.0.p0.34-el6.parcel.sha1
wget http://archive.cloudera.com/cdh5/parcels/5.11.0/manifest.json
注意:下载的sha1文件后缀要改成sha,否则CM无法认出
mv CDH-5.11.0-1.cdh5.11.0.p0.34-el6.parcel.sha1 CDH-5.11.0-1.cdh5.11.0.p0.34-el6.parcel.sha
进入CM目录
cd /var/www/html/CM
wget http://archive.cloudera.com/cm5/repo-as-tarball/5.11.0/cm5.11.0-centos6.tar.gz
tar xvf cm5.11.0-centos6.tar.gz
8.配置内网CM YUM源(CDH集群内所有主机都要配置)
cat > /etc/yum.repos.d/cm.repo << EOF
[CM]
name=CM
baseurl=http://192.168.0.128/CM/cm/5.11.0/
gpgcheck=0
enabled=1
EOF
9.安装mariadb(CM节点安装)
安装mariadb 10.1版
下载:
http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/galera-25.3.20-1.rhel6.el6.x86_64.rpm
http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/jemalloc-3.6.0-1.el6.x86_64.rpm
http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/jemalloc-devel-3.6.0-1.el6.x86_64.rpm
http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/MariaDB-10.1.25-centos6-x86_64-client.rpm
http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/MariaDB-10.1.25-centos6-x86_64-server.rpm
http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/MariaDB-10.1.25-centos6-x86_64-shared.rpm
http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/MariaDB-10.1.25-centos6-x86_64-common.rpm
http://mirrors.neusoft.edu.cn/mariadb/mariadb-10.1.25/yum/centos6-amd64/rpms/ MariaDB-10.1.25-centos6-x86_64-compat.rpm
https://downloads.mariadb.com/MariaDB/mariadb-galera-5.5.56/galera-25.3.20/rpm/jemalloc-3.6.0-1.el6.x86_64.rpm
安装:
yum localinstall galera-25.3.20-1.rhel6.el6.x86_64.rpm jemalloc-3.6.0-1.el6.x86_64.rpm jemalloc-devel-3.6.0-1.el6.x86_64.rpm MariaDB-10.1.25-centos6-x86_64-client.rpm MariaDB-10.1.25-centos6-x86_64-server.rpm MariaDB-10.1.25-centos6-x86_64-shared.rpm MariaDB-10.1.25-centos6-x86_64-common.rpm MariaDB-10.1.25-centos6-x86_64-compat.rpm
配置mysql
修改/etc/my.cnf.d/server.cnf
[mysqld]项目下增加
character-set-server=utf8
lower_case_table_names=1
启动mariadb
service mysql start
9.安装mysql connect jdbc jar包(所有主机都要安装)
wget https://cdn.mysql.com//Downloads/Connector-J/mysql-connector-java-5.1.43.tar.gz
mkdir –p /usr/share/java
tar xvf mysql-connector-java-5.1.43.tar.gz
cp mysql-connector-java-5.1.43/mysql-connector-java-5.1.43-bin.jar /usr/share/java/mysql-connector-java.jar
三、CM/CDH安装
1.CM主机安装cm server和jdk
yum -y install cloudera-manager-server.x86_64 cloudera-manager-server-db-2.x86_64 cloudera-manager-daemons.x86_64
yum -y install oracle-j2sdk1.7.x86_64
2.mariadb建立cm server元数据库,并赋权给scm用户
create database cm;
grant all on cm.* to scm@’localhost’ identified by ’scm’;
flush privileges;
3. mariadb建立CM监控组件数据库并赋权
create database amon;
create database rman;
grant all on amon.* to amon@'localhost' identified by amon;
grant all on amon.* to amon@’cm identified by ’amon’;
grant all on rman.* to rman@’cm identified by ’rman’;
flush privileges;
amon为active monitor组件数据库
rman为report manager组件数据库
MySQL [(none)]> grant all on amon.* to amon@'jc5w0gmrrep8u6.clchyxjwtayu.rds.cn-northwest-1.amazonaws.com.cn' identified by 'amon';
grant all on amon.* to amon@cm’ identified by 'amon';
4. mariadb建立CDH组件数据库并赋权
create database hive;
create database oozie;
create database hue;
grant all on hive.* to hive@’%’ identified by ‘hive’;
grant all on oozie.* to oozie@’cm’ identified by ‘oozie’;
grant all on hue.* to hue@’%’ identified by ‘hue’;
flush privileges;
5.初始化CM元数据库
CM主机执行如下命令:
/usr/share/cmf/schema/scm_prepare_database.sh mysql cm scm scm
6.开始安装CM/CDH
CM主机启动CM server服务
service cloudera-scm-server start
安装后打开页面,安装agent
输入用户名/密码:admin/admin
勾选“是的,我接受最终用户许可条款和条件。”。点击“继续”
选择“数据集线器试用版”,点击“继续”
点击“继续”进行下一步
输入加入集群的主机,使用默认端口22,点击“搜索”
可以看到需要加入集群的主机都可发现,点击继续
配置之前选择的CDH源,点击“更多选项“
删除所有默认的远程parcel存储库URL,然后点击增加前面配置的源
然后点击“保存更改“
选择对应的CDH版本,并自定义Cloudera Manager Agent存储库,点击“继续“
选中“安装 Oracle Java SE 开发工具包 (JDK)“和”安装 Java 无限制强度加密政策文件“,点击“继续”
不勾选“单用户模式”,点击“继续”
选择默认root用户,“所有主机接受相同密码“,然后输入集群内主机密码。
上图可以看到正在安装。
完成CM agent安装后点击“继续“
后面会安装CDH parcel,如上图所示
完成后点击继续
安装程序会检查主机参数是否配置正确,若有验证失败项,根据要求修改后重新运行主机检测,直到正常为止。然后点击“完成“。
选择自定义服务。
勾选HDFS,Hive,Hue,Impala,Yarn,Zookeeper,点击“继续“,进行角色分配。
HDFS部分,NameNode,SecondaryNameNode选择namenode1主机,后面会选择namenode2与现有namenode1做HA
Balancer选择namenode2主机
HttpFS,NFS Gateway留空
DataNode选择datanode1,datanode2
Hive部分,Gateway选择所有主机
Hive Metastore Server,HiveServer2选择namenode1,namenode2主机
WebHCat Server不选择
Hue部分,Hue Server选择 namenode1,namenode2主机
Impala部分,Impala Catalog Server和Impala StateStore选择namenode1
Impala Daemon和DataNode角色主机相同
Cloudera Management Service部分,所有角色都放在cm主机中
Oozie Server部分,Oozie角色放在cm主机
YARN部分,ResourceManager选择namenode1,后面会加上namenode2,做HA
JobHistory Server选择namenode2
NodeManager和DataNode角色主机相同
ZooKeeper选择cm,namenode1,namenode2主机
选择填入对应的数据库信息,测试连接没问题后继续。
审核更改:选择默认设置,点击“继续“
完成组件启动后点击“继续”
至此,CDH已经安装完成。
- 点赞
- 收藏
- 关注作者
评论(0)