- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【运维面试】k8s的监控指标

互联网老辛发表于 2021/06/08 22:52:11 2021/06/08

【摘要】一般在公司里我们都是使用prometheus进行监控，先说一下prometheus的工作核心： prometheus是使用 Pull （抓取）的方式去搜集被监控对象的 Metrics 数据（监控指标数据），然后，再把这些数据保存在一个 TSDB （时间序列数据库，比如 OpenTSDB、InfluxDB 等）当中，以便后续可以按照时间进行检索。有了这套核心监控机制，...

一般在公司里我们都是使用prometheus进行监控，先说一下prometheus的工作核心：
prometheus是使用 Pull （抓取）的方式去搜集被监控对象的 Metrics 数据（监控指标数据），然后，再把这些数据保存在一个 TSDB （时间序列数据库，比如 OpenTSDB、InfluxDB 等）当中，以便后续可以按照时间进行检索。

有了这套核心监控机制， Prometheus 剩下的组件就是用来配合这套机制的运行。比如 Pushgateway，可以允许被监控对象以 Push 的方式向 Prometheus 推送 Metrics 数据。

而 Alertmanager，则可以根据 Metrics 信息灵活地设置报警。当然， Prometheus 最受用户欢迎的功能，还是通过 Grafana 对外暴露出的、可以灵活配置的监控数据可视化界面。

kubernetes的监控体系：

宿主机的监控数据：比如节点的负载，CPU，内存，磁盘，网络这些常规的信息，当然你也可以查看https://github.com/prometheus/node_exporter#enabled-by-default
来看看这些指标，实在是太多了。
对apiserver，kubelet等组件的监控，比如工作队列的长度，请求的QPS和数据延迟等，主要是检查k8s本身的工作情况
k8s相关的监控数据，比如对pod，node，容器，service等主要k8s概念进行监控。

在监控指标的规划上需要遵从USE原则和RED原则

USE:

利用率
饱和度
错误率

RED原则：
4. 每秒请求数
5. 每秒错误数
6. 服务响应时间

这里需要注意： promotheus采用的是pull的模式。

文章来源: zmedu.blog.csdn.net，作者：互联网老辛，版权归原作者所有，如需转载，请联系作者。

原文链接：zmedu.blog.csdn.net/article/details/115476609

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

【运维面试】k8s的监控指标

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

【运维面试】k8s的监控指标

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品