- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Rancher入门到精通-2.0 高可用的K8S集群部署方案

隔壁老汪发表于 2022/06/26 00:03:52 2022/06/26

【摘要】阅读目录涉及到的内容整体拓补图SLBetcdKubernetes集群高可用验证写在最后回到目录涉及到的内容 LVSHAProxyHarboretcdKubernetes (Master Worker) 回到目录整体拓补图以上是最小生产可用的整体拓补图（相关节点根据需要进行增加，但不能减少）按功能组划分 SLB...

阅读目录

涉及到的内容
整体拓补图
SLB
etcd
Kubernetes集群
高可用验证
写在最后

回到目录

涉及到的内容

LVS
HAProxy
Harbor
etcd
Kubernetes (Master Worker)

回到目录

整体拓补图

以上是最小生产可用的整体拓补图（相关节点根据需要进行增加，但不能减少）

按功能组划分

SLB
- LVS
- HAProxy
etcd
K8S Node (Master / Worker)

回到目录

SLB

LVS 、HAProxy 被规划为基础层，主要提供了一个高可用的7层负载均衡器。
由LVS keepalived 提供一个高可用的VIP（虚拟IP）。
这个VIP DR模式转发到后端的HAProxy服务器。
HAProxy反代了K8S Master服务器，提供了K8S Master API的高可用和负载均衡能力。

可以使用Nginx代替HAProxy吗？

是可以的，这边使用HAproxy是因为k8s文档中出现了HAproxy，且后续可能会有4层反代的要求，从而使用了HAProxy。

可以直接从LVS转发到Master吗？

理论上可行，我没有试验。
如果不缺两台机器推荐还是架设一层具有7层代理能力的服务。
k8s apiserver、harbor、etcd都是以HTTP的方式提供的api，如果有7层代理能力的服务后续会更容易维护和扩展。

用途	数量	CPU	内存
Keepalive	2	4	4GB
HAProxy	2	4	4GB

etcd

etcd是一个采用了raft算法的分布式键值存储系统。
这不是k8s专属的是一个独立的分布式系统，具体的介绍大家可以参考官网，这边不多做介绍。
我们采用了 static pod的方式部署了etcd集群。

失败容忍度

最小可用节点数：(n/2)+1，下面是一个参考表格，其中加粗的是推荐的节点数量：

总数	最少存活	失败容忍
1	1	0
2	2	0
3	2	1
4	3	1
5	3	2
6	4	2
7	4	3
8	5	3
9	5	4

用途	数量	CPU	内存
etcd	3	4 (8~16)	8GB (16GB~64GB)

Kubernetes集群

kubernetes集群主要有两种类型的节点：Master和Worker。
Master则是集群领导。
Worker是工作者节点。
可以看出这边主要的工作在Master节点，Worker节点根据具体需求随意增减就好了。
Master节点的高可用拓补官方给出了两种方案。

Stacked etcd topology（堆叠etcd）
External etcd topology（外部etcd）

可以看出最主要的区别在于etcd的部署方式。
第一种方案是所有k8s Master节点都运行一个etcd在本机组成一个etcd集群。
第二种方案则是使用外部的etcd集群（额外搭建etcd集群）。
我们采用的是第二种，外部etcd，拓补图如下：

如果采用堆叠的etcd拓补图则是：

这边大家可以根据具体的情况选择，推荐使用第二种，外部的etcd。

参考来源:
https://kubernetes.io/docs/setup/production-environment/tools/kubeadm/ha-topology/

Master节点的组件

apiserver
controller-manager
scheduler

一个master节点主要含有上面3个组件 ( 像cloud-controller-manager这边就不多做说明了，正常不会用到 )
apiserver: 一个api服务器，所有外部与k8s集群的交互都需要经过它。（可水平扩展）
controller-manager: 执行控制器逻辑（循环通过apiserver监控集群状态做出相应的处理）（一个master集群中只会有一个节点处于激活状态）
scheduler: 将pod调度到具体的节点上（一个master集群中只会有一个节点处于激活状态）

可以看到除了apiserver外都只允许一个实例处于激活状态（类HBase）运行于其它节点上的实例属于待命状态，只有当激活状态的实例不可用时才会尝试将自己设为激活状态。
这边牵扯到了领导选举（zookeeper、consul等分布式集群系统也是需要领导选举）

Master高可用需要几个节点？失败容忍度是多少？

k8s依赖etcd所以不存在数据一致性的问题（把数据一致性压到了etcd上），所以k8s master不需要采取投票的机制来进行选举，而只需节点健康就可以成为leader。
所以这边master并不要求奇数，偶数也是可以的。
那么master高可用至少需要2个节点，失败容忍度是(n/0)+1，也就是只要有一个是健康的k8s master集群就属于可用状态。（这边需要注意的是master依赖etcd，如果etcd不可用那么master也将不可用）

Master组件说明:
https://kubernetes.io/docs/concepts/overview/components/
部署文档:
https://kubernetes.io/docs/setup/production-environment/tools/kubeadm/high-availability/

硬件配置

用途	数量	CPU	内存
Master	3	4	8GB

回到目录

高可用验证

至此生产可用的k8s集群已“搭建完成”。为什么打引号？因为还没有进行测试和验证，下面给出我列出的验证清单

还有涉及的BGP相关的验证不在此次文章内容中，后续会为大家说明。

回到目录

写在最后

还有一点需要注意的是物理机的可用性，如果这些虚拟机全部在一台物理机上那么还是存在“单点问题”。这边建议至少3台物理机以上。

为什么需要3台物理机以上？
主要是考虑到了etcd的问题，如果只有两台物理机部署了5个etcd节点，那么部署了3个etcd的那台物理机故障了，则不满足etcd失败容忍度而导致etcd集群宕机，从而导致k8s集群宕机。

文章来源: blog.csdn.net，作者：隔壁老瓦，版权归原作者所有，如需转载，请联系作者。

原文链接：blog.csdn.net/wxb880114/article/details/103509476

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

Rancher入门到精通-2.0 高可用的K8S集群部署方案

涉及到的内容

整体拓补图

SLB

可以使用Nginx代替HAProxy吗？

可以直接从LVS转发到Master吗？

推荐配置

etcd

失败容忍度

推荐配置

Kubernetes集群

Master节点的组件

Master高可用需要几个节点？失败容忍度是多少？

硬件配置

高可用验证

写在最后

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

Rancher入门到精通-2.0 高可用的K8S集群部署方案

涉及到的内容

整体拓补图

SLB

可以使用Nginx代替HAProxy吗？

可以直接从LVS转发到Master吗？

推荐配置

etcd

失败容忍度

推荐配置

Kubernetes集群

Master节点的组件

Master高可用需要几个节点？失败容忍度是多少？

硬件配置

高可用验证

写在最后

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品