预见 高质量的云服务
预见 高质量的云服务
如果未来可以预见,那就一起预见高质量的云服务
主讲人:华为云SRE总经理曹建辉
一、这是Cloud1.0迈向Cloud2.0的时代
过去十年是Cloud1.0的时代,未来的十年是Cloud2.0的时代。过去十年,互联网企业主导了第一波浪潮。而未来的十年,各种行业云将兴起,企业将成为云化主角。在整个新的十年,企业的整个IT状况发生了非常剧烈的变化。这些变化可以归纳为四点:
1、第一个大的变化是:传统的IT业务,比如ERP(企业资源计划)系统,办公自动化等正朝着移动化和社交化的方向发展,移动化和社交化逐渐成为这些领域的主流。同时我们也可以看到,在这之中,沿着移动化和社交化的方向,我们有了非常多的多样化的应用。
2、第二个大的变化是:现在的企业大量利用数据分析包括大数据的技术来开展数据类的业务。
3、第三个大的变化是:IT技术在企业内部不完全聚焦在Bussiness IT的领域,我们的IT技术更多的运用在了生产系统上。比如智能制造,软件开发和创新,IOT,电子商务O2O等等。越来越多的企业更倾向于将更多的IT技术运用在生产系统上来武装自己。
4、第四个大的变化是:在IT技术领域发生了非常多的有意思的变化,包括AR,VR,IOT,人工智能等技术。这些变化导致企业在未来可以用IT技术做更多的事情,甚至产生一个质的变化。有一个词叫做“奇点”,由美国的奇点大学以及一帮怪才们在进行着判断。他们提出,在2049年,“奇点”就会到来,“奇点”到来的时候,我们整个社会的人工智能的智慧水平将超过人脑。
二、华为云带给你一个全流程的方法论
很多时候,不管是虚拟还是现实之中,我们各行各业的东西都被一些新技术给牢牢地连接在了一起。在这近几年,华为同样也进入了很多的生产领域,比如华为的智能制造,华为的电子商城(Vmall),华为的消费者云,华为面向运营商领域提出来的OWS服务等。这一切都是从2010年开始,华为从Cloud2.0起所发生的全新的变化。在这么一个新IT的变化时代,企业需要更多的新的IT技术能力。但是,一般来说,这么多IT能力光靠企业自己是很难以去做到或者是实现的。那什么能做到?答案当然是云服务。所以这时候,各行各业的企业便对云服务产生了更多的要求和需求。
云具有非常多产品和功能,包括计算,存储,网络,中间件的服务,PAAS平台以及安全服务等琳琅满目的功能。但是不管是对于任何一个公有云的厂商而言,这些产品和功能都是其具有的公共的特征。那有一个问题就来了,如何利用公有云提供的如此多的产品和服务来打造和运行好企业自己的应用,来实现企业自己的业务目标呢?这时候,就需要一个全流程的方法论了,而华为云就提供了这样一个全流程的方法论。
根据全流程方法论的要求:首先,要做好设计。为了综合利用云厂商提供的服务和产品,我们要对我们的业务和应用做充分的理解,要做完整的可运行性设计。其次,要考虑如何上云,如何去做迁移。另外,上云之后,我们要考虑如何让应用稳定的运行。先进的云很重要,先进的上云能力同样重要,而这些华为云无一例外都具备。
三、全流程方法论之第一步:设计
1、可用性设计是企业设计的核心考量要素
在整个企业应用设计的过程之中,我们要强调的一点就是:可用性是核心的考量要素。尤其是对做企业城市IT的人来说,可用性基本上是这个领域永恒不变的主题。而可用性设计根据企业的发展阶段以及根据业务需求的不同而不同。
1.1、可用性设计随着企业的发展阶段的不同而不同
在业务的起步阶段,往往只需要做一个单机版,其它什么的都不用,就只做一个单机版,先做了试试再说。然后,过渡到数据备份,我们可能会将数据备份起来,使得万一数据丢失了,我们还可以再恢复。然后,我们又采用双机主备的方式,一台机器坏了,另一个备用的机器还能起来工作。再下一步,我们可以做简单的分布式集群,这个简单的集群可以不考虑跨数据中心,只在一个单数据中心领域,数据库也不用做完全的分布式改造。再往后走,可以采用异地容灾的方式,一个点垮掉了,远隔千里之外的另一个容灾系统就会起来运行。再往后,我们还可以考虑我们的业务垮掉以后,怎样才能让我们的业务不受影响或者说是基本上不受影响。为了实现这样的要求,我们可以考虑做跨数据中心分布式,同城双活,异地双活等。做跨数据中心的分布式系统,其中一个数据中心垮掉以后,我们可以保证我们的业务不受影响。而在传统IT领域,往往会采用同城双活的方案。但是对于传统IT而言,要做到同城双活是比较困难的,因为我们需要改造过去的IT系统,以Oracle,微软,IBM等为例,我们需要将其数据库系统以及应用系统进行改造,这样做不仅很困难,而且代价也会很高。最后,我们也可以做到异地多活,但是异地多活也有应用的限制,因为异地多活最难的是做到数据的实时同步,但这是不太可能做到的。对于一些对状态要求比较多的应用,如果不对其进行裁剪,是无法做到异地多活的。
1.2、可用性设计根据业务需求的不同而不同。
一些游戏公司,一开始只是单机,只在充值和用户认证等部分采用主备双机。但是当后来游戏做大做成功以后,游戏公司会马上重构整个系统。再比如,对于车联网系统而言,其对实时性要求特别高,所以做车联网的公司一定要做多活或者是双活,同时,异地容灾也是必不可少的。
2、华为在数据中心的布局上满足大家的可用性要求
华为在全国有五大区域中心,其中三个已经建立,两个正处于建设之中(贵州和内蒙古),这五大区域和三十一个省市节点之间通过网络进行高速互联。(如下图)
正因为华为云有足够的条件去提供这样的基础设施,这样的布局也使得使用者有足够的信心去做异地容灾。而在同一个区域之内,华为云是多AZ的设计,在同一个点,有两个到三个以上的数据中心。这两个到三个以上的数据中心,非常适合大家去做多活或者双活设计以及跨数据中心的分布式等。
3、华为云提供了满足大家的各种可用性要求的产品
华为云提供的具体的产品如下图所示。对于单机版而言,其中比较特别的是BMS裸金属服务,它能做到把物理服务器自动化的发放。数据备份中的CSBS整机备份,可以把整个机器复制过去,当你的的机器出现问题的时候,可以把整个机器恢复回来。业界一般做的是卷备份,也就是说把你的硬盘复制过去,但是机器出问题以后是不能给你自动进行恢复的。在主备双机的方案里,特别强调的则是华为云的ECS反亲和性和EVS共享云硬盘者这两项独特的技术。所谓的反亲和性就是主备两台虚拟机你不知道或者是忘记了它们放在了哪台服务器上,但是一旦放在同一台物理服务器上,一旦出现了问题,两台机器就会都挂了。而反亲和性的作用就是,让你指定的机器的主备两台虚拟机不会放在同一台物理服务器上。EVS共享云硬盘可以让主备两台虚拟机的硬盘不需要分开,共享同一块云硬盘,这可以使得在存储这一块有很好的可用性,也不用担心硬盘垮掉。即使主机垮掉,也不需要重新拷贝数据。关于跨数据中心的分布式,华为云提供了独特的Region级的服务,Region服务的意思是像RDS,OBS,对象存储和负载均衡等基础性的系统,华为云已经为其做了双活或者是多活。对于购买华为云服务的使用者而言,像这些基础的,容易引起用户担心的多活或者是双活的系统,华为云已经替使用者提前做好了,用户就不需要自己去搭建了。
四、全流程方法论之第二步:上云
1、企业上云的三大关注点
1.1、第一个关注点是企业对业务要有足够深刻的理解。业务有不同的可运行设计的要求,业务和业务之间有很多系统之间的关联性。对于这些内容,一定要做业务的模拟测试和评估,只有这样,在业务的迁移过程之中出现什么样的问题,这样的问题该怎么解决你才会清楚。如果贸然行事的开展迁移工作,迁移过程之中一定会出现很多问题。
1.2、第二个关注点则是停服时间,要知道公司的业务在迁移过程之中能停多久,断多久。是0停服,0断机,还是可以停24个小时?同时我们还要关注一些方案,比如网络传送的方案,备份回滚的方案。在任何时候都要考虑到,万一迁移失败了该怎么办?
1.3、第三大关注点就是要注意数据的迁移,迁移的核心其实就是数据,而迁移数据的核心就是要做到非常好的一致性要求。
2、华为云值得信赖的的迁移能力
对华为云而言,华为云能提供全流程的方案,人员,工具来帮助大家做好迁移工作。华为有完整的方法论,也有分布在全国三十一个省市的本地服务中心,也有上千个业务迁移的模型,数据库。
华为云的这种能力是从什么地方开始积累的呢?在华为整个企业的流程IT里,在全世界范围内,华为的机房和机房之间的搬移一年之内大概有五次以上。系统在不同机房之间的迁移一年至少有五十次以上。而物理服务器之间迁移一年大概有五千次以上。虚拟机之间的迁移则是数以万计。正是在这样一个长时间工作过程之中,华为云在迁移方面才有了丰富的经验。正因为有这样的丰富的经验,所以各个企业可以充分地信赖华为云的工作。
3、企业上云的路径选择
我们在上云的过程中间可能要重构我们的平台,比如说要把数据库系统换掉。如果我们的业务是一点一点的搬上去,我们是否应该考虑混合部署?但是如果我们希望做得更彻底一点,得到一个更好的架构,做到更好的弹性和可用性,这时候,我们或许就应该考虑分布式的架构等。在上云的过程之中考虑是否重构我们的应用,这也是我们的企业在上云的过程之中需要考虑到的,也是我们各行各业都应该去考虑的。
五、全流程方法论之第三步:保障
1、华为云提供上云后的运维保障
企业在上云之后,要考虑自己业务的维护。要考虑出现问题之后,我们的应急方案是什么?同时,我们还需要持续优化我们的系统。这个时候,企业其实需要一个专业的保障来持续优化其业务。
而华为云提供了一套专业的运维系统来帮助大家应急。当出了问题以后,华为云有完整的流程来提供平台的服务以帮助客户快速的恢复系统。华为云也提供了质管的服务,通过质量改进的方式来防止重复的事故。出事故是难以避免的,但是改进也是孜孜以求的。另外,在特定的时期,华为云会为客户提供专业的服务保障来应对业务的高峰期。在这些方面,华为云在其内部的流程IT系统里积累了不少的经验。比如华为的消费者云以及华为的Vmall,也正是华为云为其提供保障。比如Vmall,也就是华为的电子商城,在高峰期间,其并发用户大概有两百四十多万到三百万之间,每一分钟的订单的数量大概在十万,TCP的连接数量在六百多万。像这种时候,华为云就会给Vmall团队提供专业的应急或者是高峰期的保障。
2、华为云提供的7×24小时服务体系
重点如下:
1、华为云有遍布全国三十一个省市的本地的技术服务团队。同时,和华为云的团队打交道的时候,用户不仅知道Yes,还可以知道How。
2、华为云后端有一万多的技术支持人员在等待大家。
3、华为云的长处和其它的各行各业是互补的,华为云不懂各行各业,各行各业只需做好自己的应用。华为云的长处在于计算,存储,网络和平台方面的强大的能力,从而和各行各业能形成完整的互补。一些应用层方面的问题,在华为云的技术人员看来很简单,虽然他们不懂这个应用,而其它的问题华为云的技术人员并不懂,但是只要一牵扯到底层的华为云的东西,他们就会知道。所以在技术服务这一块,华为云会尽可能的为企业提供技术服务的支持。
4、公有云提供的服务和产品对于企业来说不应该是个黑盒子。华为云为用户提供了监控和审计的服务,各行各业可以自己进行监控,可以进行审计。华为云在任何时候做的任何操作用户都是可以看得到的。对于企业而言,这样的分权分区的管理有时候也是一种管理的需要。因为企业内部有不同的角色,所以华为云为不同的角色提供了相应的目录服务。不管是华为云的IAM还是CCS的服务,都是在帮助企业提供这方面的相应的技术,帮助企业整体上提高IT管理和运营的能力。企业管好相应的应用逻辑,华为云则尽可能的提供产品和服务来帮助企业在其业务领域成功。
六、华为云愿意与各界共同成长
在Cloud2.0时代,企业需要一朵先进的云,同样也需要同样先进的上云能力,需要为了打造和运营好企业的应用而提供的高质量全流程的服务。而华为云就是为大家提供这样的高质量全流程服务的,华为云愿意与各界共同成长。
视频链接:https://bbs.huaweicloud.com/videos/ba789acf83e611e7b8317ca23e93a891
- 点赞
- 收藏
- 关注作者
评论(0)