DevOps Roadmap 2022
在网络技术方面具有根本优势
了解HTTP/2、QUIC或HTTP3、4层和7层协议、mTLS、Proxies、DNS、BGP、负载平衡如何工作、IP表、Internet的工作、IP地址和方案,最后是网络设计。我发现Julia Evans’s博客非常有用,当我需要以简单的方式理解东西时,它是我的首选。她在博客文章和杂志中涵盖了各种各样的话题。
掌握操作系统基础知识,特别是Linux
由于大多数系统(VM、容器等)都运行Linux,所以了解从上到下是很重要的。学习调度、systemd接口、init系统、cgroups和名称空间、性能调优,并掌握命令行实用程序–awk、sed、jq、yq、curl、ssh、openssl等,从Brendan’s blog中学习性能故障排除。
CI/CD
如果你还喜欢Jenkins,没关系。但是,世界已经转向云原生管道。从概念上讲,这个领域没有太大的变化,但您可以研究一下Github Actions,Tekton等。如何更好地发布版本?了解蓝绿和金丝雀等各种部署策略。
集装箱化和虚拟化
除了流行的Docker运行时,还可以尝试containerd、podman等,了解如何容器化应用程序、如何实现容器安全性以及如何在Kubernetes中运行和编排VMs,请参见KubeVirt项目。
容器编排
Kubernetes现在是运行容器的事实上的标准。网上有很多学习Kubernetes的内容。关注配置最佳实践、应用程序设计、安全性和调度。设置集群现在变得越来越琐碎,但第二天的操作工作,如设置、监视、日志记录、CI/CD、如何扩展集群、成本优化和安全性,是人们可能会从您那里期待的一些问题。
在这篇由Asankov撰写的文章中,您可以了解到Kubernetes冰山下面是什么。这是一系列探讨Kubernetes的article。
可观测性
大多数工程师都知道普罗米修斯格拉法纳堆栈或类似的。趋势表明,从性能和成本的角度来看,许多组织正在巩固他们的Kubernetes集群和可观察性,这很有帮助。学习Prometheus的高级配置和架构,以及如何扩展它们。研究一下灭霸、Cortex、VictoriaMetrics、Datadog和Loki等技术。连续剖面工具,如Parca、潜望镜、hypertrace和开放式遥测分布式跟踪。像Istio这样的服务网格是云原生食谱中的流行成分。
平台团队作为产品团队
平台团队的功能变得越来越像一个集中的产品团队,专注于其内部平台客户,如开发人员和测试人员。目标是改进工作方式,给团队带来一些秩序。尝试对开发人员和QA团队面临的问题进行即兴思考。你是其他团队的推动者,而不是在一个中心团队中承担所有的工作,而是指导开发团队承担典型的DevOps责任。这样你就可以扩大规模,不要太烧自己。
安全
在许多小组织中,保安是二等公民。产品特性被给予更多的优先考虑。但是,由于日益复杂的攻击和各种严格的合规要求,公司正在适应左移安全策略。端到端加密、强RBAC、IAM策略、治理和审计,以及NIST、CIS、ISO27001等基准的实现都是常见的。容器安全、策略作为代码、云治理和供应链安全是热门话题。
程序设计
DevOps或SRE角色现在正在处理开发人员的跨领域问题,并创建工具,在执行标准的同时帮助提高他们的生产率。良好的软件工程实践和技能是制作高质量平台组件所必需的。
我不能给这个足够的压力。好的组织在平台工程师中寻找良好的编程经验。它在现场可靠性工程中也很重要,在那里你需要流利的编程,能够阅读、理解和调试其他人编写的代码,并在必要时修复它。
Python和Golang是最受欢迎的。我的建议是Golang,因为它具有强大的并发性、严格的类型检查、在各种机构中的采用、工具链以及许多主要项目都是使用Golang构建的,所以通过Python学习它是有意义的。
你可以尝试一些简单的事情:
- 用您的编程语言编写CLI。
- 学习编写REST API并与数据库交互
- 并行性和并发性
作为代码的基础结构
Terraform是项目中的标准。一旦您理解了这个概念,就很容易适应任何其他工具,因为大多数工具都是基于DSL的。
Cloud
大多数云的工作方式都是一样的。因此,如果您非常了解一种云,您就可以轻松地与其他云提供商合作。关注如何以高可用性、弹性、安全和低成本的方式使用云原生组件设计应用程序。
技术写作
您可能想知道为什么我在讨论DevOps时谈到技术写作。很多人对此没有给予足够的重视,但这在你如何与其他团队沟通和工作中是非常重要的。未来的工作是远程的,电子邮件、休闲/团队和聊天是与他人交谈和传达想法的主要渠道。
在常规的基础上,您可能会创建文档,例如运行手册、后期文档、RFC、架构决策记录和软件设计文档等等。一个清晰、易于理解的文档会带来奇迹。它可以帮助您节省您和读者的时间,并提高整体生产力。建议你阅读this article。
Site Reliability Engineering
DevOps和SRE之间的界限正在变得越来越细。在一些组织中,同一个人可能同时扮演两个角色。理解SLI、SLO和错误预算背后的概念和SRE实践。每个组织都有不同的做法,所以我不建议将别人的文化复制到你的团队中。参考Google SRE culture
结论
- Service Mesh — Istio, Cilium Sidecarless mesh, Tetrate and Solo’s Gloo mesh offering.
- 如何提高开发人员的生产力?它是文化、自动化和工具的混合体。
- SRE Platforms — honeycomb, Last9.
- DevPortals-再次与提高生产力和弥合知识差距的动机联系在一起。
- 可观测行-技术,如open telemetry, hypertrace, Thanos, VictoriaMetrics, Vector.
- 安全-供应链安全,码上签下,收紧云上安全。
- Golang-提高当前的技能
- 无服务器计算和事件驱动体系结构
- Web3-了解与DevOps和基础设施相关的景观
- 点赞
- 收藏
- 关注作者
评论(0)