创原会走进B站 | 畅聊云上创新与精益运营背后的技术

举报
创原会 发表于 2023/05/24 11:22:50 2023/05/24
【摘要】 [上海,2023年5月20日]畅聊云原生·第九期以创新&精益为主题,既探讨了最热的AIGC,也分享了企业在SRE、finops等领域的最佳实践,活动荣幸地邀请到B站基础架构部SRE体系负责人刘昊,小红书音视频架构部门负责人陈靖,浙江大学计算机科学与技术学院教授赵洲,华为云容器服务首席架构师张琦,九章云极技术合伙人王俊鹏,创原会副理事长、华为云marketing部长董理斌进行主题分享和思想碰撞

畅聊云原生[第九期]以创新&精益为主题,既探讨了最热的AIGC,也分享了企业在SRE、finops等领域的最佳实践,活动荣幸地邀请到B站基础架构部SRE体系负责人刘昊,小红书音视频架构部门负责人陈靖,浙江大学计算机科学与技术学院教授赵洲,华为云容器服务首席架构师张琦,九章云极技术合伙人王俊鹏,创原会副理事长、华为云marketing部长董理斌进行主题分享和思想碰撞。

大合照.jpeg

▲  创原会全体嘉宾合影

5月20日,由创原会与B站联合举办的畅聊云原生[第九期]在B站上海总部成功举办,会议以”创新&精益,为技术发电”为主题,来自B站、小红书、爱奇艺、游族网络、七猫、美的、smart、复星集团、华为云、亚马逊、浙江大学等30多位产业精英、技术专家、学术大咖齐聚,围绕SRE质量运营、音视频、AIGC、FinOps等话题展开了主题分享与深入交流,共同探索企业云上创新和精益运营的最佳路径。

▍B站SRE质量运营体系与实践

刘昊老师.jpeg

▲  B站基础架构部SRE体系负责人 刘昊

随着软件架构从最初的单节点、单线程向分布式、微服务的方向不断演进,软件系统复杂度极速上升,软件系统已逐步成为稳定性事故的重灾区。传统质量运营模式,存在着告警内容密集、琐碎、故障影响舆情扩散快、缺乏标准SOP、跨团队协作难、复盘智能留存难且过度依靠两端人员等问题。 B站基础架构部SRE体系负责人刘昊介绍说:“为了解决以上问题,B站构建了一套覆盖故障发生前后的各类事件的运维体系,该体系可以通过平台化能力提升故障发生效率、降低故障时间、深挖故障价值、确保问题及时恢复和改进。”

事前:通过全面分析事件产生来源、构建标准化事件模型、定义接入标准等一系列手段,对事件进行集约化管理、全链路闭环。

事中:基于统一事件来识别挖掘业务风险,闭环管控风险,提升风险处理效率和风险数据化,并将人、业务、系统、信息间的协同线上化,围绕MTTR的四大阶段,实现针对性能力覆盖,缩减故障应急时间,冲击1-5-10。

事后:围绕故障的关键信息,构建结构化复盘模式,并针对5大阶段拟定28个拷问点定量拷问,提升复盘质量和效率。

未来,B站还将在业务质量云运营、业务风险防控、质量意识建设方面持续投入。

▍云原生时代的UGC和AIGC

陈靖老师.jpeg

  ▲  小红书音视频架构部门负责人 陈靖

随着内容生产由进入到工业化、智能化时代,支撑业务发展所需的架构,也由传统的单体服务架构向微服务化、容器化、Serverless化的云原生架构演进,小红书音视频架构部门负责人陈靖介绍说:“小红书自成立之初,便坚定地选择云原生方式来构建基础业务平台,因此小红书可以将主要精力投入到业务研发,快速进行业务迭代升级,并在业务交付速度、媒体质量和整体成本三方面取得了较大成功。”在随后的演讲中,陈靖详细介绍了小红书在构建视频的微服务架构和容器化部署过程中的主要成功实践:

-  媒资内容管理按照微服务架构设计。通过分层服务设计降低业务接入复杂度,如:原子数据能力微服务化,增强业务扩展的灵活性;统一媒资数据协议,降低业务使用复杂度。

- 微服务治理及持续集成。基于容器注册中心管理所有微服务实例,流量调度;持续集成部署平台,实现服务开发到部署全面自动化。

- 存储及数据引擎容器化,可灵活在多云多地域切换。

面对AIGC的兴起,陈靖认为AIGC会带来内容数量爆炸性增长会为现有视频平台带来一定的挑战,但是基于云原生的架构开放性、灵活性的特点,视频平台可以快速升级、扩容来消解这些挑战。

最后陈靖总结说:“架构设计只有需要遵循的原则,没有固定成法,过度设计往往会给业务带来负面影响,因此要谨记技术是为业务服务的。”

▍AudioGPT: 生成式语音模型

赵洲老师.jpeg

▲  浙江大学计算机科学与技术学院教授 赵洲

语音驱动的人像视频合成是虚拟人领域的一个热门话题,但由于相同的语音可能有多种合理的面部动作,因此不同说话人、不同语种、不同表现形式(如歌声)等域外音频难以生成准确的面部表情。为解决以上难题,浙江大学计算机科学与技术学院赵洲教授团队所开发的 GeneFace项目采用 3D 人脸关键点作为中间变量,提出了一个三阶段的框架:

- 第一阶段——语音转动作:在大规模唇语识别数据集上学习语音到动作的映射,使模型能够享受大数据集带来的高泛化能力。

- 第二阶段——动作域迁移:赵洲教授团队提出了一种基于对抗训练的域适应方法,以训练一个人脸动作的后处理网络,从而弥合大规模唇语识别数据集与目标人视频之间的域差距。

- 第三阶段——基于动作渲染视频:通过设计一个基于 NeRF 的渲染器(3DMM NeRF Renderer),预测 3D 人脸关键点,并以此条件来渲染高保真的人像说话视频。

通过三阶段优化,GeneFace 相比基准方法实现了更好的图像质量、更好的嘴唇对齐程度,尤其是在受域外语音驱动时,GeneFace 的优势更加明显。

目前,GeneFace项目全面开源:https://github.com/yerfor/GeneFace

▍FinOps,云上成本管理探索

张琦老师.jpeg

▲ 华为云容器服务首席架构师 张琦

上云趋势持续加深,但云上开支存在显著浪费,云原生FinOps通过可视化的成本洞察和成本优化,帮助用户精益用云,提升单位成本的资源利用率,实现降本增效目标,已成为企业上云成本管理的最优手段。华为云容器服务首席架构师张琦认为,云原生混部通过应用全域统一调度和资源分级管控,实现了成本的高效治理,是企业降本的银弹,其优势主要体现在:

- 通过微服务和批量计算任务分时使用资源消减集群和节点资源碎片:业务集群相互融合,组成较大的资源池,多个业务混合部署到一起,既减小集群资源碎片,又能通过大小应用的装箱和重调度,进一步消减集群碎片,提升资源分配率。

- 微服务和批量计算任务融合、统一调度:提供队列、组、作业优先级、公平调度、资源预留等多种抽象,统一满足微服务、大数据、AI多业务调度需求。

- 多种技术保障业务的QoS:在CPU、内存、网络、L3缓存等多维度上为应用提供高优低优的自动控制,使资源分时复用,提升资源利用率。

- 业务跨集群统一管理,部署,资源最优:通过打通多集群资源池,为应用提供统一的资源视图,实现部署运行最优、服务流量治理最优。

华为云已将相关优秀实践总结并开源成Volcano、Karmada、Kurator等项目,并在互联网、金融等行业得到广泛采用。

现场嘉宾还就自身企业在SRE体系建设、智能运维、微服务架构、多云管理、成本管理等方面所遇到的问题和针对AIGC等创新技术的洞见展开了进一步的深入交流与探讨,探索企业上好云、用好云、管好云的最佳路径。

现场.jpeg

创原会组织的畅聊云原生·走进云原生企业系列活动为更多的企业提供了相互了解、学习、互助的机会。创原会副理事长董理斌表示:创原会作为华为云联合中国信通院、CNCF成立的全球技术交流平台,经过两年多发展已经具备了完善的运营体系。一方面我们将持续做好线上线下的技术交流,另一方面要更深入的走到会员企业现场交流。未来希望每一位创原会会员,都可以深度参与,分享自己的实践和感悟,把这个平台越办越好。

董.jpeg

▲ 创原会副理事长董理斌

 # 畅聊云原生    用观点链接“一群人”的智慧  

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

举报
请填写举报理由
0/200