DevOps Roadmap 2022

举报
kaliarch 发表于 2022/08/13 15:04:22 2022/08/13
【摘要】 在网络技术方面具有根本优势了解HTTP/2、QUIC或HTTP3、4层和7层协议、mTLS、Proxies、DNS、BGP、负载平衡如何工作、IP表、Internet的工作、IP地址和方案,最后是网络设计。我发现Julia Evans’s博客非常有用,当我需要以简单的方式理解东西时,它是我的首选。她在博客文章和杂志中涵盖了各种各样的话题。 掌握操作系统基础知识,特别是Linux由于大多数系...

在网络技术方面具有根本优势

了解HTTP/2、QUIC或HTTP3、4层和7层协议、mTLS、Proxies、DNS、BGP、负载平衡如何工作、IP表、Internet的工作、IP地址和方案,最后是网络设计。我发现Julia Evans’s博客非常有用,当我需要以简单的方式理解东西时,它是我的首选。她在博客文章和杂志中涵盖了各种各样的话题。

掌握操作系统基础知识,特别是Linux

由于大多数系统(VM、容器等)都运行Linux,所以了解从上到下是很重要的。学习调度、systemd接口、init系统、cgroups和名称空间、性能调优,并掌握命令行实用程序–awk、sed、jq、yq、curl、ssh、openssl等,从Brendan’s blog中学习性能故障排除。

CI/CD

如果你还喜欢Jenkins,没关系。但是,世界已经转向云原生管道。从概念上讲,这个领域没有太大的变化,但您可以研究一下Github Actions,Tekton等。如何更好地发布版本?了解蓝绿和金丝雀等各种部署策略。

集装箱化和虚拟化

除了流行的Docker运行时,还可以尝试containerd、podman等,了解如何容器化应用程序、如何实现容器安全性以及如何在Kubernetes中运行和编排VMs,请参见KubeVirt项目。

容器编排

Kubernetes现在是运行容器的事实上的标准。网上有很多学习Kubernetes的内容。关注配置最佳实践、应用程序设计、安全性和调度。设置集群现在变得越来越琐碎,但第二天的操作工作,如设置、监视、日志记录、CI/CD、如何扩展集群、成本优化和安全性,是人们可能会从您那里期待的一些问题。

在这篇由Asankov撰写的文章中,您可以了解到Kubernetes冰山下面是什么。这是一系列探讨Kubernetes的article

可观测性

大多数工程师都知道普罗米修斯格拉法纳堆栈或类似的。趋势表明,从性能和成本的角度来看,许多组织正在巩固他们的Kubernetes集群和可观察性,这很有帮助。学习Prometheus的高级配置和架构,以及如何扩展它们。研究一下灭霸、Cortex、VictoriaMetrics、Datadog和Loki等技术。连续剖面工具,如Parca、潜望镜、hypertrace和开放式遥测分布式跟踪。像Istio这样的服务网格是云原生食谱中的流行成分。

平台团队作为产品团队

平台团队的功能变得越来越像一个集中的产品团队,专注于其内部平台客户,如开发人员和测试人员。目标是改进工作方式,给团队带来一些秩序。尝试对开发人员和QA团队面临的问题进行即兴思考。你是其他团队的推动者,而不是在一个中心团队中承担所有的工作,而是指导开发团队承担典型的DevOps责任。这样你就可以扩大规模,不要太烧自己。

安全

在许多小组织中,保安是二等公民。产品特性被给予更多的优先考虑。但是,由于日益复杂的攻击和各种严格的合规要求,公司正在适应左移安全策略。端到端加密、强RBAC、IAM策略、治理和审计,以及NIST、CIS、ISO27001等基准的实现都是常见的。容器安全、策略作为代码、云治理和供应链安全是热门话题。

程序设计

DevOps或SRE角色现在正在处理开发人员的跨领域问题,并创建工具,在执行标准的同时帮助提高他们的生产率。良好的软件工程实践和技能是制作高质量平台组件所必需的。
我不能给这个足够的压力。好的组织在平台工程师中寻找良好的编程经验。它在现场可靠性工程中也很重要,在那里你需要流利的编程,能够阅读、理解和调试其他人编写的代码,并在必要时修复它。
Python和Golang是最受欢迎的。我的建议是Golang,因为它具有强大的并发性、严格的类型检查、在各种机构中的采用、工具链以及许多主要项目都是使用Golang构建的,所以通过Python学习它是有意义的。
你可以尝试一些简单的事情:

  • 用您的编程语言编写CLI。
  • 学习编写REST API并与数据库交互
  • 并行性和并发性

作为代码的基础结构

Terraform是项目中的标准。一旦您理解了这个概念,就很容易适应任何其他工具,因为大多数工具都是基于DSL的。

Cloud

大多数云的工作方式都是一样的。因此,如果您非常了解一种云,您就可以轻松地与其他云提供商合作。关注如何以高可用性、弹性、安全和低成本的方式使用云原生组件设计应用程序。

技术写作

您可能想知道为什么我在讨论DevOps时谈到技术写作。很多人对此没有给予足够的重视,但这在你如何与其他团队沟通和工作中是非常重要的。未来的工作是远程的,电子邮件、休闲/团队和聊天是与他人交谈和传达想法的主要渠道。
在常规的基础上,您可能会创建文档,例如运行手册、后期文档、RFC、架构决策记录和软件设计文档等等。一个清晰、易于理解的文档会带来奇迹。它可以帮助您节省您和读者的时间,并提高整体生产力。建议你阅读this article

Site Reliability Engineering

DevOps和SRE之间的界限正在变得越来越细。在一些组织中,同一个人可能同时扮演两个角色。理解SLI、SLO和错误预算背后的概念和SRE实践。每个组织都有不同的做法,所以我不建议将别人的文化复制到你的团队中。参考Google SRE culture

结论

  • Service Mesh — Istio, Cilium Sidecarless mesh, Tetrate and Solo’s Gloo mesh offering.
  • 如何提高开发人员的生产力?它是文化、自动化和工具的混合体。
  • SRE Platforms — honeycomb, Last9.
  • DevPortals-再次与提高生产力和弥合知识差距的动机联系在一起。
  • 可观测行-技术,如open telemetry, hypertrace, Thanos, VictoriaMetrics, Vector.
  • 安全-供应链安全,码上签下,收紧云上安全。
  • Golang-提高当前的技能
  • 无服务器计算和事件驱动体系结构
  • Web3-了解与DevOps和基础设施相关的景观
【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。