idou老师教你学Istio 14:如何用K8S对Istio Service进行流量健康检查

举报
云容器大未来 发表于 2019/01/30 17:37:48 2019/01/30
【摘要】 Istio利用k8s的探针对service进行流量健康检查,有两种探针可供选择,分别是liveness和readiness:liveness探针用来侦测什么时候需要重启容器。readiness探针用来使容器准备好接收流量。

Istio利用k8s的探针对service进行流量健康检查,有两种探针可供选择,分别是liveness和readiness:

liveness探针用来侦测什么时候需要重启容器。比如说当liveness探针捕获到程序运行时出现的一个死锁,这种情况下重启容器可以让程序更容易可用。

readiness探针用来使容器准备好接收流量。当所有容器都ready时被视为pod此时ready。比如说用这种信号来控制一个后端服务,当pod没有到ready状态时,服务会从负载均衡被移除。




使用场景:

liveness探针被用来移除异常的pod,不重启pod就无法恢复的应用常使用liveness探针。比如前文提到的死锁,进程会一直处于活跃状态,k8s会认为正常并继续发送流量。但使用liveness探针之后会发现应用已经不再处理请求,继而重启异常pod。

readiness探针被用来控制流量进入pod。比如应用程序需要加载一个大的文件或者需要启动后进行一些配置。但默认只要容器进程启动完成就会有流量发送过来。使用readiness探针会一直等待直到完成所有加载或配置再让流量进入。

两种探针的配置相似,区别在于使用livenessProbe还是readinessProbe字段


探针配置参数:

探针有以下几个参数:

initialDelaySeconds:容器启动之后到启动探针之间的时延

periodSeconds:探针的循环执行时间,最小单位为1秒

timeoutSeconds:探针超时时间,默认值1秒

successThreshold: 成功阈值数,失败之后最小的连续成功信号数,liveness必须是1

failureThreshold:失败阈值数,当探针失败之后,在放弃之前k8s尝试重新执行探针次数,如果是liveness探针放弃意味着重启容器,readiness探针意味着pod标记为unready,默认值为3次。


HTTP探针还有以下额外的参数:

host: 所连接主机名,默认值是pod IP

scheme: HTTP或者HTTPS

path: 访问HTTP 服务器的路径

httpHeaders: 访问HTTP的报头

port:访问容器的端口


探针可以进行三种操作:

  • 命令行:在容器中执命令行操作,exit 0为成功状态

  • HTTP请求:向容器发送HTTP GET请求,如果返回值为200-400之间为成功状态

  • TCP 请求:向指定端口发送TCP请求,如果该端口开放监听,则为成功


下面我们来演示以下健康检查的操作:

命令行操作

首先准备busybox镜像,设置如下的yaml配置文件:

0130_1.jpg

在配置文件中我们设置了一个liveness探针,在容器启动之后的5s,每隔5s去执行一下访问/tmp/healthy这个文件的操作,如果操作成功返回0,则为容器健康,如果返回值不为0, 会重启容器。

当容器启动之后会执行:

touch /tmp/healthy; sleep 30; rm -rf /tmp/healthy; sleep 600

前30s会建立/tmp/healthy文件,30s之后删除,此时访问会返回错误.

使用kubectl create -f ./your-exec-liveness.yaml建立pod

0130_2.jpg

在30s之内通过kubectl describe pod liveness-exec来查看pod状态,为健康:

0130_3.jpg

在30s之后查看pod的状态,发现无法访问文件,返回不健康:

0130_4.jpg

之后查看pod的状态,pod的重启次数为1,此时通过liveness探针检测到不健康状态已经重启pod。

0130_5.jpg

如果使用readiness探针,需要修改上文your-exec-liveness.yaml的红框字段:

0130_6.jpg

通过与上文相同的方法,在30s之前查看pod的状态,为ready:

0130_7.jpg

在30s之后查看pod状态,readiness探针将应用容器置为unready, ready的容器是istio-proxy:

0130_8.jpg

可以看到readiness探针并不会重启容器。


HTTP请求

另一种使用liveness探针的方法是HTTP GET请求,可以用来监测网页的运行状态,我们用google liveness镜像来进行演示:

0130_9.jpg

这里我们让HTTP的服务器/healthz路径前10s返回200 的OK状态,10s之后返回状态500。

设置如下的配置文件:

0130_10.jpg

liveness探针会向容器的8080端口发送请求访问/healthz, 在容器启动3s之后每隔3s发送一次。我们建立pod并查看pod的运行状态kubectl describe pod liveness-http:

0130_11.jpg

会发现10s之后 liveness探针监测到了返回值是500,状态标记为不健康。


TCP请求

两种探针还可以共同使用,下面以TCP请求为例,TCP和HTTP连接类似。使用google的goproxy镜像,该镜像会在8080端口开放TCP socket连接,使用如下的配置文件:

0130_12.jpg

我们用探针去访问8000端口查看pod状态;此时理论上应该无法连接:

0130_13.jpg

可以看到readiness探针会每隔10s监测,无法访问时会将pod置于unready状态,liveness探针20s监测,无法成功则重启pod。

 

通过以上演示我们了解了如何配置两种探针和执行三种操作。通过合理的探针配置,可以实时监控Istio各个pod的运行状态,提供方便的应用治理手段。


相关服务请访问https://support.huaweicloud.com/cce/index.html?cce_helpcenter_2019


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。