【华为云Stack】【大架光临】第15期:从“一云多芯”支持,看多元算力的全栈云方案

大架光临 发表于 2022/11/10 17:40:21 2022/11/10
【摘要】 随着IT快速发展,政企客户业务上云需求不仅体现在功能上,同时也呈现在底层硬件的架构选型中来。政企客户IT系统常常有不同的CPU架构,上云后将存在“一云多芯”的场景,这对业务适配和云厂商都提出了更高要求。华为云Stack如何在不同CPU架构下,构建多元算力的全栈解决方案?本文将为你具体阐释。

作者:徐安 华为云Stack资深架构师

背景

华为云Stack作为华为云在政企市场的解决方案政企客户智能升级的首选平台随着政企客户数字化的不断深入,业务需求也由单一的X86架构变为多元化,上云要求也随之变的复杂给华为云Stack也带来了很多不一样的挑战和新问题

泛政府客户为例,客户会协同办公OA系统、电子公文等非涉密系统部署在电子政务外网上,采用传统虚拟机、物理机部署方式,基础IaaS即可满足业务部署需求。因此IaaS云平台向下屏蔽不同CPU架构的硬件差异,向上提供服务化的算力模型封装算力相关的存储网络操作系统监控运维等以服务化的方式提供。所以IaaS云平台支持不同的CPU架构,解决“云多芯”问题,是最基础的能力要求基于此,容器、大数据、中间件、数据库等更多云服务,均可以在IaaS云平台上为客户提供,最终华为云Stack为客户构建一朵多元算力的全栈云方案。


针对“云多芯”的解决办法

一、不同CPU架构的特点分析

目前主流的新创CPU架构有以下几个:

考虑到各CPU架构的成熟度和性能,我们以鲲鹏海光飞腾作为华为云Stack支持CPU的首选。这些CPU架构又有各自的技术特点:

1、鲲鹏

CPU核心通过环形架构互联通过扩展计算单元数量来支持众核架构采用7nm工艺Die内均等内存和IO访问能力

2、海光

CPU核心通过Die之间互联架构来连接采用12nm工艺一个CPU4Die或者2Die一个Die固定有2个计算单元,一个计算单元内4海光核

3、飞腾

Die之间通过2D Mesh方式互联,一个CPU支持8Die一个Die与两个或者三个Die2D Mesh方式互联


二、华为云Stack技术方案特点

根据上述不同CPU架构特点,华为云Stack采用:CPU架构混合部署、亲和性部署方案,应对云多芯”现象;同时,华为云Stack还有全创新的软硬件,为政企客户提供坚实的基础

1、不同CPU架构混合部署

面对不同CPU架构的不同特点,华为云Stack进行混合部署。可以理解为把数个杂乱无序的商品,整齐陈列到便利店,所有品类都能放到便利店中、同类商品统一陈列、特殊商品也有自己的位置。有算力需求时,就如同用户走入便利店,能快速、高效的找到想要的东西

具体混合部署方式如下:

(1) 华为云Stack支持多个CPU架构在一朵云上共存客户可以按照自己的业务诉求,管控硬件资源和业务环境,实现高效管理。

(2) 把相同CPU架构,放入对应的资源池中。比如把Intel CPU和海光CPU鲲鹏CPU和飞腾CPU,分别放入x86ARM资源池中对于那些没有使用特殊指令的应用,可在不同厂商CPU之间流动,可高效管控资源池,提高资源池利用效率,减少资源碎片

(3) 业务镜像仅按照操作系统区分,不区分CPU架构,如果操作系统可兼容不同的CPU架构,可在同资源池内复用

(4) 对于有特殊指令诉求的业务负载,可通过规则中参数来指定业务放置在哪里比如指定x86-虚拟机-规格,就会在Intel CPU服务器或者海光CPU服务器上选定一个地方放置

2、考虑不同CPU架构之间的差异,支持亲和性部署

想象你有几个编制不同演奏方式不同的乐队,为了每次收到新的曲子,都能最快的编排出,你需要提前收集这几个乐队的架构、声部、主要领队人等等,把这些信息登记在册。之后再收到新的曲子,只需查阅之前的记录,就可以实现人员的精准分工了。

亲和性部署,就是把不同的CPU架构差异,记录在数据库表中,收到新的算力需求,实现调度匹配

    华为云Stack部署业务的步骤可以参考以下逻辑

(1) 获取CPU topo,包括SocketDie架构计算单元核心超线程的关系。支持鲲鹏,intel,海光,飞腾CPU

(2) 获取的CPU topo在系统中保存

(3) 按照调度算法放置不同的业务负载

(4) 用户可按照CPU topo的形态呈现现有CPU架构,剩余CPU资源,已经使用的CPU资源

华为云Stack部署业务的算法基本原则如下,可以供业界同学参考学习

(1) 按照numa距离总量最小的组合,选择Die

(2) die先填满一个计算单元,再填满另一个计算单元

(3) 使用局部最优悲观算法来考虑碎片问题

%2) 如果要使用的资源可被一个计算单元整除,优先以计算单元为单位填满碎片,如若还有剩余,用碎片填满

%2) 如果要使用的资源不可被一个计算单元整除,优先用碎片填满

3、可信的云覆盖处理器、服务器、存储、数据库、操作系统、云平台全创新

    华为云Stack软硬件均自主创新包括鲲鹏CPU、还包括昇腾AI处理器存储控制器芯片网络控制器芯片服务器管理芯片。也包括上面的服务器集中式和分布式存储交换机路由器防火墙等设备。华为掌握鲲鹏ARM、openEuler(开源)、openGauss(开源)等三大根技术,可为有诉求的政企客户提供安全可靠的云底座平台。


写在最后

随着政企客户上云诉求增多,华为云Stack也面临不同的挑战我们充分考虑到客户目前拥有不同CPU架构的现实,通过分析主流CPU架构的技术特点,一方面全面支持云多芯的设备能力另一方面,通过硬件到软件的方案,政务客户提供可信场景下,智能升级首选方案。为政企客户的全面云化打造了一个坚实有力、稳定可靠上云基座

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区),文章链接,文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:cloudbbs@huaweicloud.com进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。