- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Kubernetes自动伸缩：HPA与Cluster Autoscaler

数字扫地僧发表于 2025/03/27 18:54:45 2025/03/27

【摘要】一、项目背景在云计算和微服务架构蓬勃发展的今天，企业对应用程序的部署和管理提出了更高的要求。Kubernetes作为容器编排领域的佼佼者，凭借其强大的自动化和可扩展性，成为众多企业构建云原生应用的首选平台。自动伸缩功能作为Kubernetes的核心特性之一，能够根据应用程序的负载情况动态调整资源分配，确保应用在不同负载下都能获得最佳性能，同时避免资源浪费，降低运营成本。二、Kuberne...

一、项目背景

在云计算和微服务架构蓬勃发展的今天，企业对应用程序的部署和管理提出了更高的要求。Kubernetes作为容器编排领域的佼佼者，凭借其强大的自动化和可扩展性，成为众多企业构建云原生应用的首选平台。自动伸缩功能作为Kubernetes的核心特性之一，能够根据应用程序的负载情况动态调整资源分配，确保应用在不同负载下都能获得最佳性能，同时避免资源浪费，降低运营成本。

二、Kubernetes自动伸缩概述

2.1 自动伸缩的必要性

随着互联网应用的普及，用户对服务的可用性和响应速度要求越来越高。传统的静态资源配置方式已无法满足现代应用的需求。例如，在电商促销活动期间，网站流量会呈指数级增长，若服务器资源不足，可能导致网站崩溃，影响用户体验和业务收益；而在非高峰期，过多的资源又会造成浪费。因此，Kubernetes的自动伸缩功能应运而生，它能够实时监控应用负载，并根据预设规则自动调整资源，确保服务的稳定运行和资源的高效利用。

2.2 自动伸缩的核心原理

Kubernetes自动伸缩的核心在于根据预设的指标和策略，动态地调整应用的副本数量或资源分配。其基本原理可概括为以下几点：

监控指标：Kubernetes通过监控指标来了解应用的运行状况，常用的监控指标包括CPU利用率、内存利用率、网络流量等。
评估策略：基于监控指标，Kubernetes会根据预设的评估策略来确定是否需要进行自动伸缩，例如根据CPU利用率超过阈值来触发扩容。
执行动作：一旦触发自动伸缩，Kubernetes会根据预设的伸缩方案执行相应的动作，包括扩容、缩容或保持不变。

2.3 自动伸缩的类型

Kubernetes支持多种类型的自动伸缩，主要包括以下几种：

水平Pod自动伸缩（HPA）：根据CPU利用率、内存利用率等指标动态调整Pod的副本数量。
垂直Pod自动伸缩（VPA）：根据容器内资源的需求动态调整Pod的CPU和内存资源。
集群节点自动伸缩（Cluster Autoscaler）：根据集群资源利用率动态调整集群节点的数量。

三、HPA与Cluster Autoscaler详解

3.1 水平Pod自动伸缩（HPA）

3.1.1 HPA的工作原理

HPA（Horizontal Pod Autoscaler）是Kubernetes中实现自动扩缩容Pod副本数量的机制。它允许集群中的工作负载（如Deployments、ReplicaSets和StatefulSets）根据实际的负载情况自动调整Pod的数量，以此来优化资源的使用和提高服务的响应能力。

HPA基于Master上的kube-controller-manager服务启动参数horizontal-pod-autoscaler-sync-period定义的时长（默认为30秒），周期性地检测Pod的CPU使用率。它通过追踪分析Replication Controller（RC）、Deployment或Replica Set控制的所有目标Pod的负载变化情况，来确定是否需要针对性地调整目标Pod的副本数。

3.1.2 HPA的关键组件

HPA的实现依赖于多个关键组件的协同工作，这些组件包括：

组件名称	功能描述
HPA控制器（HPA Controller）	负责监控目标Pod的负载情况，并根据预设规则自动调整Pod副本数量
Metrics Server	提供集群资源的使用情况，包括CPU和内存的使用情况，供HPA决策使用
自定义指标适配器（Custom Metrics Adapter）	用于支持自定义指标，将自定义指标适配为HPA可识别的格式
Deployment/ReplicaSet	管理Pod副本的控制器，HPA通过调整其replicas参数来实现Pod数量的扩缩容
Pods	Kubernetes中的基本工作单元，HPA的目标就是根据指标自动调整Pod的数量
API服务器（API Server）	Kubernetes API服务器是集群的通信中心，所有资源的创建、更新和删除都通过它进行
Kubelet	运行在每个节点上的守护进程，负责维护Pod的生命周期，包括启动、停止容器

3.1.3 HPA的配置与部署

在部署HPA之前，需要先部署Metrics Server，因为HPA依赖于Metrics Server提供的资源使用数据来做出伸缩决策。

部署Metrics Server

以下是部署Metrics Server的步骤：

# 创建工作目录
mkdir hpa

# 下载Metrics Server配置文件
wget https://github.com/kubernetes-sigs/metrics-server/releases/download/v0.7.1/components.yaml

# 修改配置文件
vim components.yaml

# 修改镜像地址，例如将registry.k8s.io/metrics-server/metrics-server:v0.7.1修改为registry.aliyuncs.com/google_containers/metrics-server:v0.7.1

# 禁用证书验证，在容器参数中添加--kubelet-insecure-tls等参数

# 应用配置
kubectl apply -f components.yaml

# 验证安装
kubectl get pod -A | grep metrics
kubectl top nodes

创建Deployment并设置资源请求

接下来，创建一个Deployment，并在其中设置资源请求，以便HPA能够根据这些请求计算资源使用率：

apiVersion: apps/v1
kind: Deployment
metadata:
  name: nginx-deployment
spec:
  replicas: 2
  selector:
    matchLabels:
      app: nginx
  template:
    metadata:
      labels:
        app: nginx
    spec:
      containers:
      - name: nginx
        image: nginx:latest
        resources:
          requests:   # 必须设置requests供HPA计算使用率
            cpu: 100m # 至少node节点需要有100毫核的cpu
            memory: 128Mi # 至少node节点需要有128M的内存使用

应用上述Deployment配置：

kubectl apply -f test-dep.yml

创建HPA控制器

创建HPA控制器，指定目标Deployment、指标类型（如CPU利用率）以及最小和最大副本数等参数：

kubectl autoscale deployment nginx-deployment --cpu-percent=50 --min=2 --max=10

上述命令表示当nginx-deployment的Pod平均CPU利用率超过50%时，HPA会自动增加Pod副本数，最多扩展到10个副本；当CPU利用率低于50%时，HPA会减少Pod副本数，最少缩减到2个副本。

监控HPA状态

可以使用以下命令查看HPA的当前状态和历史伸缩活动：

kubectl get hpa
kubectl describe hpa nginx-deployment

3.2 集群节点自动伸缩（Cluster Autoscaler）

3.2.1 Cluster Autoscaler的工作原理

Cluster Autoscaler是一个可以自动伸缩集群Node的组件。如果集群中有未被调度的Pod，它将会自动扩展Node来使Pod可用，或是在发现集群中的Node资源使用率过低时，删除Node来节约资源。

Cluster Autoscaler通常需要搭配云厂商使用，它提供了Cloud Provider接口供各个云厂商接入，云厂商通过伸缩组（Scaling Group）或节点池（Node Pool）的功能对ECS类产品节点进行增加删除等操作。

3.2.2 Cluster Autoscaler的部署

部署Cluster Autoscaler的步骤如下：

apiVersion: extensions/v1beta1
kind: Deployment
metadata:
  name: cluster-autoscaler
  labels:
    k8s-app: cluster-autoscaler
spec:
  replicas: 1
  selector:
    matchLabels:
      k8s-app: cluster-autoscaler
  template:
    metadata:
      labels:
        k8s-app: cluster-autoscaler
    spec:
      containers:
      - image: cluster-autoscaler:latest
        name: cluster-autoscaler
        command:
        - ./cluster-autoscaler
        - --nodes={{MIN}}:{{MAX}}:k8s-worker-asg-1
        # 其他启动参数按需添加

在上述配置中，{{MIN}}是最小节点数，{{MAX}}是最大节点数，k8s-worker-asg-1是伸缩组或节点池的名称，需要根据实际环境进行替换。

3.2.3 Cluster Autoscaler的使用场景

Cluster Autoscaler适用于以下场景：

场景描述	适用性
应用负载波动大，需要动态调整节点数量以满足需求	高度适用
节省成本，通过自动缩减闲置节点减少资源浪费	高度适用
多租户环境，不同租户的应用负载变化不同，需要灵活的资源分配	适用
需要与云厂商的弹性伸缩功能集成，实现全自动化的资源管理	适用

四、案例分析：电商网站的自动伸缩实践

4.1 项目背景

某大型电商企业在促销活动期间，网站流量会急剧增加，导致后端服务压力增大。为了应对这种流量高峰，同时避免在非高峰期浪费资源，该企业决定采用Kubernetes的自动伸缩功能来优化资源管理。

4.2 HPA在电商网站中的应用

在电商网站的后端服务中，采用了HPA来自动调整Pod副本数量。通过监控Pod的CPU和内存使用率，当负载超过预设阈值时，HPA自动增加Pod副本，以分担负载；当负载降低时，HPA减少Pod副本，释放资源。

例如，对于处理订单服务的Deployment，配置了HPA如下：

apiVersion: autoscaling/v2beta2
kind: HorizontalPodAutoscaler
metadata:
  name: order-service-hpa
spec:
  scaleTargetRef:
    apiVersion: apps/v1
    kind: Deployment
    name: order-service
  minReplicas: 5
  maxReplicas: 50
  metrics:
  - type: Resource
    resource:
      name: cpu
      targetAverageUtilization: 60
  - type: Resource
    resource:
      name: memory
      targetAverageUtilization: 70

上述配置表示当order-service的Pod平均CPU利用率超过60%或内存利用率超过70%时，HPA会自动增加Pod副本，最多扩展到50个副本；当CPU和内存利用率都低于目标值时，HPA会减少Pod副本，最少缩减到5个副本。

4.3 Cluster Autoscaler在电商网站中的应用

除了HPA，该电商企业还部署了Cluster Autoscaler来自动调整集群节点数量。在促销活动期间，当Pod副本数量增加导致现有节点资源不足时，Cluster Autoscaler会自动添加新的节点到集群中，以满足应用的资源需求；而在活动结束后，当节点资源使用率降低时，Cluster Autoscaler会自动删除多余的节点，节省成本。

通过这种方式，企业实现了从Pod到节点的全链条自动伸缩，确保了在高流量期间服务的稳定性和响应速度，同时在低流量期间最大限度地节约了资源和成本。

五、总结与展望

5.1 总结

本文深入探讨了Kubernetes的自动伸缩功能，重点介绍了HPA和Cluster Autoscaler的工作原理、配置与部署过程，并结合电商网站的实际案例分析了它们的应用效果。通过合理配置和使用HPA与Cluster Autoscaler，企业能够实现应用的弹性伸缩，优化资源利用，降低运营成本，提升服务的可靠性和用户体验。

5.2 展望

随着云原生技术的不断发展和企业对资源管理精细化要求的提高，Kubernetes的自动伸缩功能将不断完善和扩展。未来可能会出现更多类型的自动伸缩策略和工具，如基于机器学习的智能伸缩、多维度综合指标评估的伸缩决策等，以满足日益复杂的应用场景和业务需求。同时，自动伸缩与其他云原生技术（如服务网格、无服务器架构等）的深度集成也将成为发展趋势，为企业构建更加高效、灵活、智能的云原生应用生态系统提供有力支持。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入