云计算-构建Ceph集群分布式存储部署

嚯嚯嚯www 发表于 2022/05/17 20:06:56 2022/05/17
【摘要】 Ceph是一种软件定义存储,Ceph的分布式基因使其可以轻易管理成百上千个节点、PB级及以上存储容量的大规模集群,同时基于计算的扁平寻址设计使得Ceph客户端可以直接和服务端的任意节点通信,从而避免因为存在访问热点而导致性能瓶颈。Ceph是一个统一存储系统,即支持传统的块、文件存储协议,例如SAN和NAS;也支持对象存储协议,例如S3和Swift。Ceph文件系统(CephFS)Linux内...

Ceph是一种软件定义存储,Ceph的分布式基因使其可以轻易管理成百上千个节点、PB级及以上存储容量的大规模集群,同时基于计算的扁平寻址设计使得Ceph客户端可以直接和服务端的任意节点通信,从而避免因为存在访问热点而导致性能瓶颈。Ceph是一个统一存储系统,即支持传统的块、文件存储协议,例如SAN和NAS;也支持对象存储协议,例如S3和Swift。

Ceph文件系统(CephFS)Linux内核驱动程序支持CephFS,这也使得CephFS高度适用于各大Linux操作系统发行版。CephFS将数据和元数据分开存储,为上层的应用程序提供较高的性能以及可靠性。

Ceph可以配合云计算平台,轻松实现分布式存储统一架构,完成超融合技术的落地。

Ceph系统有几大组件,OSD\Monitor\MDS\Managers
Ceph OSD:
Ceph的OSD(Object Storage Device)守护进程。主要功能包括:存储数据、副本数据处理、数据恢复、数据回补、平衡数据分布,并将数据相关的一些监控信息提供给Ceph Moniter,以便Ceph Moniter来检查其他OSD的心跳状态。一个Ceph OSD存储集群,要求至少两个Ceph OSD,才能有效的保存两份数据。注意,这里的两个Ceph OSD是指运行在两台物理服务器上,并不是在一台物理服务器上运行两个Ceph OSD的守护进程。通常,冗余和高可用性至少需要3个Ceph OSD。
Monitor:
Ceph的Monitor守护进程,主要功能是维护集群状态的表组,这个表组中包含了多张表,其中有Moniter map、OSD map、PG(Placement Group) map、CRUSH map。 这些映射是Ceph守护进程之间相互协调的关键簇状态。 监视器还负责管理守护进程和客户端之间的身份验证。 通常需要至少三个监视器来实现冗余和高可用性。
MDS:
Ceph的MDS(Metadata Server)守护进程,主要保存的是Ceph文件系统的元数据。注意,对于Ceph的块设备和Ceph对象存储都不需要Ceph MDS守护进程。Ceph MDS为基于POSIX文件系统的用户提供了一些基础命令的执行,比如ls、find等,这样可以很大程度降低Ceph存储集群的压力。
Managers:
Ceph的Managers(Ceph Manager),守护进程(ceph-mgr)负责跟踪运行时间指标和Ceph群集的当前状态,包括存储利用率,当前性能指标和系统负载。 Ceph Manager守护程序还托管基于python的插件来管理和公开Ceph集群信息,包括基于Web的仪表板和REST API。 通常,至少有两名Manager需要高可用性。

Ceph RBD IO流程

image.png
官网:https://ceph.io/
中文文档:http://docs.ceph.org.cn/

实验拓扑:

image.png
部署三个分布式Ceph节点,一台Client用于测试

一、安装配置Ceph服务

1.配置服务器时间同步

安装一台节点为主时间服务器,配置如下
image.png

其余服务器设置上游地址为主服务器
image.png

启动服务即可,chronyc sources查看
image.png

2.安装Ceph创建集群

在node1节点安装ceph-deploy
[root@ceph-node1 yum.repos.d]# yum -y install ceph-deploy
image.png

若无则创建/etc/ceph配置文件夹,且所有ceph-deploy命令的执行都要在该文件夹下
#进入/etc/ceph,创建ceph集群

[root@ceph-node1 ~]# mkdir /etc/ceph
[root@ceph-node1 ~]# cd /etc/ceph/
[root@ceph-node1 ceph]# ceph-deploy new ceph-node1

image.png

集群创建完成后,工作目录下会创建集群配置文件和密钥文件
image.png

#在node1上执行install命令,可以直接在所有节点安装ceph软件包
[root@ceph-node1 ceph]# ceph-deploy install ceph-node1 ceph-node2 ceph-node3
image.png
image.png

#安装完成后,可以输入ceph -v查看版本检查是否安装成功

[root@ceph-node1 ~]# ceph -v
ceph version 0.94.5 (9764da52395923e0b32908d83a9f7304401fee43)
[root@ceph-node2 ~]# ceph -v
ceph version 0.94.5 (9764da52395923e0b32908d83a9f7304401fee43)
[root@ceph-node3 ~]# ceph -v
ceph version 0.94.5 (9764da52395923e0b32908d83a9f7304401fee43)

#在node1节点上创建第一个monitor
[root@ceph-node1 ceph]# ceph-deploy --overwrite-conf mon create-initial
image.png

#检查集群状态,可以看到此时处于不健康状态

[root@ceph-node1 ceph]# ceph -s
    cluster 37b6fbec-7562-404a-8a43-2e443f53937e
     health HEALTH_ERR
            64 pgs stuck inactive
            64 pgs stuck unclean
            no osds
     monmap e1: 1 mons at {ceph-node1=192.168.1.31:6789/0}
            election epoch 2, quorum 0 ceph-node1
     osdmap e1: 0 osds: 0 up, 0 in
      pgmap v2: 64 pgs, 1 pools, 0 bytes data, 0 objects
            0 kB used, 0 kB / 0 kB avail
                  64 creating

3.配置磁盘创建OSD

#disk list 列出节点上的所有可用磁盘,这里sdb为为服务器新加的50G磁盘

[root@ceph-node1 ceph]# ceph-deploy disk list ceph-node1
[ceph_deploy.conf][DEBUG ] found configuration file at: /root/.cephdeploy.conf
。。。。。。
[ceph-node1][DEBUG ] /dev/sdb other, unknown

#对磁盘进行分区:parted磁盘分区,mklabel修改卷标,mkpart分区

[root@ceph-node1 ceph]# parted /dev/sdb
GNU Parted 3.1
使用 /dev/sdb
Welcome to GNU Parted! Type 'help' to view a list of commands.
(parted) mklabel                                                          
新的磁盘标签类型? gpt                                                    
是/Yes/否/No? yes                                                         
(parted) mkpart                                                           
分区名称?  []?                                                           
文件系统类型?  [ext2]?                                                                                                                     
起始点? 0%                                                               
结束点? 100%                                                             
(parted) p    #输出当前分区信息                                                            
Model: VMware, VMware Virtual S (scsi)
Disk /dev/sdb: 53.7GB
Sector size (logical/physical): 512B/512B
Partition Table: gpt
Disk Flags: 
Number  Start   End     Size    File system  Name  标志
 1      1049kB  53.7GB  53.7GB

(parted) q                                                                
信息: You may need to update /etc/fstab.
[root@ceph-node1 ceph]# lsblk
NAME            MAJ:MIN RM  SIZE RO TYPE MOUNTPOINT
sdb               8:16   0   50G  0 disk 
└─sdb1            8:17   0   50G  0 part

#对分区进行格式化,创建挂载目录进行挂载,并将文件夹权限配置为777

[root@ceph-node1 ceph]# mkfs.xfs /dev/sdb1
[root@ceph-node1 ceph]# mkdir /opt/osd1
[root@ceph-node1 ceph]# mount /dev/sdb1 /opt/osd1/
[root@ceph-node1 ceph]# chmod 777 /opt/osd1/

三个node节点都把磁盘进行相同操作
image.png
image.png
image.png

#在node1节点创建OSD节点
[root@ceph-node1 ceph]# ceph-deploy osd prepare ceph-node1:/opt/osd1 ceph-node2:/opt/osd2 ceph-node3:/opt/osd3
image.png

创建完成后,在三个节点中,修改osd下所有文件的权限为777
image.png

#确认权限修改777后,激活OSD节点
[root@ceph-node1 ceph]# ceph-deploy osd activate ceph-node1:/opt/osd1/ ceph-node2:/opt/osd2 ceph-node3:/opt/osd3

#再次查看集群状态,此时为健康模式

[root@ceph-node1 ceph]# ceph -s
    cluster 37b6fbec-7562-404a-8a43-2e443f53937e
     health HEALTH_OK
     monmap e1: 1 mons at {ceph-node1=192.168.1.31:6789/0}
            election epoch 2, quorum 0 ceph-node1
     osdmap e13: 3 osds: 3 up, 3 in
      pgmap v19: 64 pgs, 1 pools, 0 bytes data, 0 objects
            15460 MB used, 134 GB / 149 GB avail
                  64 active+clean

#最后开放权限给其他节点
[root@ceph-node1 ceph]# ceph-deploy admin ceph-node{1,2,3}
image.png

二、Ceph测试使用

1.安装ceph客户端

搭建一台Ceph-Client测试机:配置网络及yum源,配置主机名和hosts文件

[root@ceph-node1 ceph]# echo '192.168.1.34 ceph-client' >> /etc/hosts

#在node1节点上安装client上所需的ceph软件
[root@ceph-node1 ceph]# ceph-deploy install ceph-client
image.png

#在node1节点上开放权限给client
[root@ceph-node1 ceph]# ceph-deploy admin ceph-client
image.png

2.Ceph客户端使用

#rbd creata创建块设备镜像image,map映射image为块设备

[root@ceph-client ~]# rbd create foo  --size 4096 -m ceph-node1 -k /etc/ceph/ceph.client.admin.keyring 
[root@ceph-client ~]# rbd map foo --name client.admin -m ceph-node1 -k /etc/ceph/ceph.client.admin.keyring 
/dev/rbd0

image.png

#rbd0块设备格式化并挂载,正常使用

[root@ceph-client ~]# mkfs.xfs /dev/rbd0
meta-data=/dev/rbd0              isize=256    agcount=9, agsize=130048 blks
         =                       sectsz=512   attr=2, projid32bit=1
         =                       crc=0        finobt=0
data     =                       bsize=4096   blocks=1048576, imaxpct=25
         =                       sunit=1024   swidth=1024 blks
naming   =version 2              bsize=4096   ascii-ci=0 ftype=0
log      =internal log           bsize=4096   blocks=2560, version=2
         =                       sectsz=512   sunit=8 blks, lazy-count=1
realtime =none                   extsz=4096   blocks=0, rtextents=0
[root@ceph-client ~]# mkdir /mnt/test
[root@ceph-client ~]# mount /dev/rbd0 /mnt/test
[root@ceph-client ~]# df -h|grep rbd0
/dev/rbd0                4.0G   33M  4.0G    1% /mnt/test

3.调整块设备大小

#info foo可以查看当前块设备信息,此时容量为4G

[root@ceph-client ~]# rbd info foo
rbd image 'foo':
        size 4096 MB in 1024 objects
        order 22 (4096 kB objects)
        block_name_prefix: rb.0.1026.238e1f29
        format: 1

#使用resize命令将大小修改至10G

[root@ceph-client ~]# rbd resize --size 10240 foo
Resizing image: 100% complete...done.
[root@ceph-client ~]# rbd info foo
rbd image 'foo':
        size 10240 MB in 2560 objects
        order 22 (4096 kB objects)
        block_name_prefix: rb.0.1026.238e1f29
        format: 1

特别注意的是,调整文件系统命令:

resize2fs命令          针对的是ext2、ext3、ext4文件系统
xfs_growfs命令         针对的是xfs文件系统

#执行调整文件系统大小,即可查看文件大小被扩容至10G

[root@ceph-client ~]# xfs_growfs /dev/rbd0
[root@ceph-client ~]# df -h|grep rbd0
/dev/rbd0                 10G   33M   10G    1% /mnt/test

4.删除块设备

#1、取消块设备挂载 ->2、取消镜像与块设备的映射 -> 3、删除设备镜像

[root@ceph-client ~]# df -h|grep rbd0
/dev/rbd0                 10G   33M   10G    1% /mnt/test
[root@ceph-client ~]# umount /dev/rbd0
[root@ceph-client ~]# rbd unmap /dev/rbd/rbd/foo 
[root@ceph-client ~]# rbd rm foo
Removing image: 100% complete...done.

三、Ceph命令

1.检查ceph安装状态

[root@ceph-node1 ceph]# ceph status
    cluster 37b6fbec-7562-404a-8a43-2e443f53937e
     health HEALTH_OK
     monmap e1: 1 mons at {ceph-node1=192.168.1.31:6789/0}
            election epoch 2, quorum 0 ceph-node1
     osdmap e13: 3 osds: 3 up, 3 in
      pgmap v20: 64 pgs, 1 pools, 0 bytes data, 0 objects
            15459 MB used, 134 GB / 149 GB avail
                  64 active+clean

2.检查monitor仲裁状态

[root@ceph-node1 ceph]# ceph quorum_status --format json-pretty
{
    "election_epoch": 2,
    "quorum": [
        0
    ],
    "quorum_names": [
        "ceph-node1"
    ],
    "quorum_leader_name": "ceph-node1",
    "monmap": {
        "epoch": 1,
        "fsid": "37b6fbec-7562-404a-8a43-2e443f53937e",
        "modified": "0.000000",
        "created": "0.000000",
        "mons": [
            {
                "rank": 0,
                "name": "ceph-node1",
                "addr": "192.168.1.31:6789\/0"
            }
        ]
    }
}

3.导出monitor信息

[root@ceph-node1 ceph]# ceph mon dump
dumped monmap epoch 1
epoch 1
fsid 37b6fbec-7562-404a-8a43-2e443f53937e
last_changed 0.000000
created 0.000000
0: 192.168.1.31:6789/0 mon.ceph-node1

4.查看集群使用

[root@ceph-node1 ceph]# ceph df
GLOBAL:
    SIZE     AVAIL     RAW USED     %RAW USED 
    149G      134G       15459M         10.07 
POOLS:
    NAME     ID     USED     %USED     MAX AVAIL     OBJECTS 
    rbd      0         0         0        46019M           0 

5.检查monitor、OSD、PG配置组 状态

[root@ceph-node1 ceph]# ceph mon stat
e1: 1 mons at {ceph-node1=192.168.1.31:6789/0}, election epoch 2, quorum 0 ceph-node1
[root@ceph-node1 ceph]# ceph osd stat
     osdmap e13: 3 osds: 3 up, 3 in
[root@ceph-node1 ceph]# ceph pg stat
v20: 64 pgs: 64 active+clean; 0 bytes data, 15459 MB used, 134 GB / 149 GB avail

6.列出PG

[root@ceph-node1 ceph]# ceph pg dump
image.png

7.列出ceph存储池

[root@ceph-node1 ceph]# ceph osd lspools
0 rbd,

8.检查OSD的crush

[root@ceph-node1 ceph]# ceph osd tree
ID WEIGHT  TYPE NAME           UP/DOWN REWEIGHT PRIMARY-AFFINITY 
-1 0.14996 root default                                          
-2 0.04999     host ceph-node1                                   
 0 0.04999         osd.0            up  1.00000          1.00000 
-3 0.04999     host ceph-node2                                   
 1 0.04999         osd.1            up  1.00000          1.00000 
-4 0.04999     host ceph-node3                                   
 2 0.04999         osd.2            up  1.00000          1.00000 

9.列出集群的认证密钥

[root@ceph-node1 ceph]# ceph auth list
installed auth entries:
osd.0
        key: AQBFsx1f/+qKFRAAyLOYuF7ep/FXLMI5yca/zg==
        caps: [mon] allow profile osd
        caps: [osd] allow *
osd.1
        key: AQBRsx1fXCGlHBAAViSH6eCjRI7NbrLFWGajrQ==
        caps: [mon] allow profile osd
        caps: [osd] allow *
osd.2
        key: AQBksx1fgjK9NRAAe827GWfDqfMtwxRqJ3D0sA==
        caps: [mon] allow profile osd
        caps: [osd] allow *
client.admin
        key: AQAsrh1fAngFJhAAKPsed40MDoLgbvk7L4kuJg==
        caps: [mds] allow
        caps: [mon] allow *
        caps: [osd] allow *
client.bootstrap-mds
        key: AQAtrh1fcaafBxAA3EOMSIIlggVmUwPs6lIFzw==
        caps: [mon] allow profile bootstrap-mds
client.bootstrap-osd
        key: AQAsrh1fYXJsMRAAQR1fAeuSAfJ+ze4YHei7Hw==
        caps: [mon] allow profile bootstrap-osd
client.bootstrap-rgw
        key: AQAsrh1f6O+BORAAiWjtCwFnVgkjaVfFQXtTKQ==
        caps: [mon] allow profile bootstrap-rgw
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区),文章链接,文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:cloudbbs@huaweicloud.com进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。