- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

平安证券Kubernetes容器集群的DevOps实践

winkho 发表于 2019/05/28 23:45:28 2019/05/28

【摘要】最近两三年，Docker容器技术及Kubernetes编排调度系统，在DevOps领域，大有星火燎原，一统天下之势。平安证券IT团队一直紧跟最新技术，践行科技赋能。本次分享，聚焦于公司在DevOps转型过程中的几个典型的技术细节的解决方案，希望对同行有所借鉴和帮助。

本文主要内容：

1. 生产环境的高可用Master部署方案

2. 分层的Docker镜像管理

3. Dashboard，Prometheus，Grafana的安全实践

4. 一个能生成所有软件包的Jenkins Job

5. 计算资源在线配置及应用持续部署

前言：

5月16日，美国《福布斯》杂志发布了2019年“全球上市公司2000强”排行榜（Forbes Global 2000）。2019年榜单前十分别为：工商银行、摩根大通、建设银行、农业银行、美国银行、苹果、中国平安、中国银行、荷兰皇家壳牌、富国银行。得益于营业收入、利润、资产规模、市值等各项指标的稳健增长，中国平安跻身全球第7位，较去年提升3位。

在前面众多微信的分享系列中，对k8s的体系构成，各个概念的定义，各组件的作用等都已介绍多次，此处就不再重复这些内容。在这篇文章中，主要和大家分享一些我们平安证券在容器云时代的一些CI/CD(持续集成/交付)的积累和经验。

平安证券成立于1991年，在近30年的时间内，积累了很多不同的IT应用，公司上下一直在紧跟IT前沿应用，践行科技赋能。

弹指挥间，白驹过隙。

最近两三年，Docker和k8s结合的容器云技术，席卷全球。各大公司争相使用，用以更快的交付速度，更好的软件质量，更低的硬件成本来保持企业技术竞争力。平安证券在这一技术浪潮影响之下，也投了人力物力，进行容器编排调度方面的技术积累和项目改造。目前，这一改造目前正在稳步推进之中，欢迎各位建言献策！

--------------------------------------------

一，生产环境的高可用master部署方案

K8s的高可用master部署，现在网络上成熟的方案不少。大多数是基于haproxy和Keepalived实现vip的自动漂移部署。至于haproxy和Keepalived,可独立出来，也可寄生于k8s master节点。

我司在IT设备的管理上有固定的流程，VIP这种ip地址不在标准交付范围之内。于是，我们设计了基于DNS解析的高可用方案。这种方案，是基于load bal--ancer变形而来。图示如下：

这种构架方案，平衡了公司的组织结构和技术实现。如果真发生master挂掉，系统应用不受影响，DNS的解析切换可在十分钟内指向新的master IP，评估在可接受范围之内。

公司内部安装master节点时，使用了基本工具是Kubeadm，但是作了脚本化改造及替换成了自己的证书生成机制。经过这样的改进之后，使用kubeadm进行集群安装时，就更有条理性，步骤更清晰，更易于在公司进行推广。

当以dns域名的形式进行部署后，各个证书配置认证文件，就不会再以IP形式连接，而是以dns域名形式连接api-server了。如下图所示：

------------------------------

二，分层的docker镜像管理

接下来，我们分享一下对docker镜像的管理。Docker的企业仓库，选用的是业界流行的harbor仓库。根据公司研发语言及框架的广泛性，采用了三层镜像管理，分为公共镜像，业务基础镜像，业务镜像(tag为部署发布单)，层层叠加而成，即形成标准，又照顾了一定的灵活性。

公共镜像：一般以alpine基础镜像，加上时区调整，简单工具。

业务基础镜像：在公共镜像之上，加入jdk,tomcat,node,python等中间件环境。

业务镜像：在业务基础镜像之上，再加入业务软件包。

-----------------------------------------------------

三， Dashboard,Prometheus,grafana的安全实践

尽管在k8s本身技术栈之外，我司存在体系化的日志收集，指标监控及报警平台，为了运维工具的丰富，我们还是在k8s内集成了常用的dashboard,Prometheus,grafana组件，实现一些即时性运维操作。

这些组件部署，我们都纳入一个统一的nginx一级url下，二级url才是各个组件的管理地址。这样的设计，主要是为了给dashborad及prometheus增加一层安全性(grafana自带登陆验证)。

这时，可能有人有疑问，dashboard,kubectl都是可以通过cert证书及rbac机制来实现安全性的，那为什么要自己来引入nginx作安全控制呢？

在我们的实践过程中，cert证书及rbac方式，结合ssh登陆帐号，会形成一系列复杂操作，且推广难度高，我们早期实现了这种模式，但目前公司并不具备应用条件，所以废弃了。公司的k8s集群，有专门团队负责运维，我们就针对团队设计了这个安全方案。

关于使用nginx统一代理dashboard,grafana,Prometheus二级目录访问

可参考：

https://blog.csdn.net/weixin_34137799/article/details/86135026

-------------------------------------------

四，一个能生成所有软件包的jenkins job

在CI流水线实践，我们选用的gitlab作为源代码管理组件，jenkins作为编译组件。但为了能实现更高效标准的部署交付，公司内部实现一个项目名为prism(棱镜)的自动编译分发部署平台。在容器化时代，衍生出一个prism4k项目，专门针对k8s环境作CI/CD流程。Prism4k版的构架图如下所示：