在组织变革中重塑运维生产力——途游游戏运维安全总监邹轶
来源:华为云SRE确定性运维专刊(第二期)
数字化浪潮席卷而来,每个企业都身在其中,途游作为一家为全球用户提供在线休闲娱乐产品及服务的互联网公司,强大的技术支持是游戏稳定性的核心,作为途游的运维团队,如何提升游戏平台运维效率,保障游戏有足够的稳定性和安全性,源于团队独创的“工作原则”,不断应用于游戏平台中,为用户提供全方位技术保障。
落地运维能力,重塑团队运维生产力
伴随数字经济的发展,与游戏产业上云用云的演进,本质就是一场“效率革命”,而作为企业数字化转型支撑的IT运维,也被赋予了更高的价值与使命。运维安全团队本质是服务,通过服务管理、产品工具交付与消费者价值共创,途游未来的发展方向是顾问型、解决方案型、平台型的服务团队,这就是途游运维团队的角色认知。
途游运维团队的目标,通过践行devops(开发自运维,自服务)理念,通过产品和工具输出服务,帮助项目组更好更高效的自服务。这有助力提升途游运维开发效率,聚焦在游戏开发上云、服务器架构的弹性运维,安全性保障等,帮助实现游戏业务的可持续发展。
途游运维团队通过建立“自下而上驱动、自上而下支持”的团队文化,不断沉淀游戏产业运维数字化转型的经验,以创新型的人力适应日渐复杂的运维需求,构建起全景运维数字资产,用技术解决业务问题,提高运维开发效率,以适应游戏环境中的稳定运行。
组织创新是运维团队发展的核心
能力聚合,提升运维价值。途游运维团队着眼于业务和服务,不断挖掘新的价值点,扩展运维服务的价值,创立了“OPS服务体系方法论”,以用户为中心、构建安全、可靠、高效、低成本、可持续发展的服务,通过服务运营创造价值,通过产品和工具落地服务运营,并持续迭代改善整个服务体系。
组织协作,打破竖井思维。组织最重要的是人,途游运维团队通过OKR工作法来打通协作,提升工作结果,通过review机制不断迭代调整,保持目标一致。在信息共享机制上,崇尚透明,鼓励共享一切有价值的信息,在内部公开讨论问题,鼓励利用公共项目管理工具来记录问题,跟进问题。
团队管理,实现自主可控。途游运维团队鼓励“去中心化”的管理机制,自组织,发现问题都可以指出来或者牵头拉组推动解决。鼓励一线员工承担更多责任和更多
自主决策。中心管理者更多的是参与者,而不是决策者,是教练,而不是运动员。所有员工都是团队的领导者,鼓励就团队发展过程中任何问题发表自己看法,参与团队的共创。
决策思维,改变决策方法。在决策的机制上,提高团队的思考力至关重要。考虑问题站在上一级去思考,落地执行站在一线去落地,比如一线员工站在小组负责人角度去思考,小组负责人站在中心负责人角度去思考,落地都要站在一线员工角度去落地。
构建敏捷方法论提升团队运维效率
现在很多公司都在使用敏捷开发,途游运维团队以scrum敏捷方法框架+精益思想(定义价值、识别价值流、让价值流流动,拉动、持续改善)开展工作。通过服务台/变更管理(风险评估,授权)-->事态管理(监控,可观测性建设)-->故障管理(尽早发现,尽快恢复)-->问题管理(找根因,建立短中长期改进计划)-->持续改进(7步改进法落地改进)-->知识库管理(沉淀经验教训)的闭环方法论指导服务运营工作开展,基于敏捷的方法论,紧密结合业务场景来进行设计,不断提升运维效率。
如今的运维已经步入智能化、数字化运维时代,运维岗位被赋予更重要的价值,途游运维团队对内不以分工为边界,而以共同目标为导向,积极协同推动目标达成。对外秉承共赢思维,把服务方视为合作伙伴而不是简单甲、乙方,联合共创,通过平台聚合各运维能力,使能运维场景创新。
随着数字技术的深入应用,要求运维人员建立与掌握,业务运营感知能力、基础架构运维掌控能力和敏态业务支撑能力,这种能力为运维工作中提升了新思路和新方法,为企业提升IT运维效能发挥出更高的价值。可以说,新技术与理念为途游运维提供了新思路、新方法,如何落地在游戏应用的转型场景中,实践更为重要,也为途游游戏的平台稳定提供了有力支撑。
拓展阅读:华为云SRE确定性运维专刊(第二期)
- 点赞
- 收藏
- 关注作者
评论(0)