Telemetry介绍

举报
犇鑫 发表于 2022/05/31 21:49:55 2022/05/31
【摘要】 一. 什么是Telemetry?Telemetry 是新一代从设备上远程高速采集数据的网络监控技术,设备通过“推模式(Push Mode)”周期性地主动向采集器上送设备信息,提供更实时、更高速、更精确的网络监控功能。具体来说,Telemetry 按照 YANG 模型组织数据,利用 GPB (GoogleProtocol Buffer)格式编码,并通过 gRPC(Google Remote P...

一. 什么是Telemetry?
Telemetry 是新一代从设备上远程高速采集数据的网络监控技术,设备通过“推模式(Push Mode)”周期性地主动向采集器上送设备信息,提供更实时、更高速、更精确的网络监控功能。具体来说,Telemetry 按照 YANG 模型组织数据,利用 GPB (GoogleProtocol Buffer)格式编码,并通过 gRPC(Google Remote Procedure Call Protocol)协议传输数据,使得数据获取更高效,智能对接更便捷。
相对传统的“拉模式(Pull Mode)”,即采集器与设备之间是一问一答的交互,Telemetry具有如下优势。
- 采用“推模式”主动推送数据,降低设备压力。
- 以亚秒级的周期推送数据,避免网络延时造成数据不准确。
- 可以监控大量网络设备,弥补传统网络由于采用“拉模式”造成监控方式的不足。


二.Telemetry vs SNMP
SNMP是小型简单网络的主流技术,足以满足用户业务目标和网络运营需求;Telemetry作为后起之秀,在大型数据网络中表现出许多优势,2者有如下主要差异。
1.SNMP采用“拉模式”,Telemetry采用“推模式”。
SNMP采用“拉模式”采集CPU占有率数据时,由于采集器与设备之间是一问一答的交互,每次下发查询请求,设备都需要解析请求报文,即n次查询请求、n次解析请求。而Telemetry的“推模式”,它只需要1次订阅请求和1次解析请求,就可以按照订阅时指定的采集周期持续推送数据给采集器。

2.SNMP采用MIB定义数据结构,Telemetry采用YANG定义数据结构。
MIB是非结构化的数据模型,由各个厂家自行定义,也就是说如果采集器要采集其他厂家的设备数据,需要花很大力气去学习该厂家的MIB模型。另外,MIB输出的对象值没有明确的属性定义,解析复杂。YANG是结构化的数据模型,各个厂家使用统一的语法,标准化。另外,能够清晰的定义业务对象、属性和数据类型,解析简单,无需特殊的适配工作。

3.SNMP采集周期为秒级,Telemetry采集周期为亚秒级。
由于SNMP是基于定期查询的模式,不仅设备开销高,而且采集周期跟Telemetry相对是太慢,导致无法精确监控网络状态。

三.Telemetry的应用有哪些?
1.流量实时调优
过去,客户网络采用SNMP技术,通常5分钟上报一次设备数据,导致客户网络无法支撑实时监控。此外,大规模数据上报时,设备性能存在瓶颈,会出现数据断点。如下图所示,利用Telemetry技术,维护部门可以以秒级的采集周期获取到设备数据,及时对异常情况进行分析,并快速下发配置调整设备。同时,调整后的状态,维护平台能实时收到,整个过程是良性运转。
2.微突发检测
过去,客户网络存在微突发现象,超过设备转发能力的报文将被丢弃。微突发越多,业务重传的比例越高,网络通信质量越差。如下图所示,采用Telemetry方式上报的流量统计可以明显看到微突发现象,通过Telemetry高精度采样,可以检测到这些微突发。


四.Telemetry是如何工作的?
Telemetry是一个闭环的自动化运维系统,也称为智能运维系统,由网络设备、采集器、分析器和控制器等部件组成。其中,这些部件既可以使用第三方的系统,也可以使用华为的系统。华为Telemetry系统中,网络设备对应的产品是CloudEngine交换机,采集器和分析器对应的产品是iMaster NCE-FabricInsight,控制器对应的产品是iMaster NCE-Fabric。完整的Telemetry系统分为5个过程。

订阅采集数据,订阅设备的采集数据,以及订阅哪些采集数据,在这个阶段完成。
推送采集数据,设备依据订阅数据方式,将采集完成的数据,上报给采集器进行接收和存储。
读取数据,分析器读取采集器存储的采集数据。
分析数据,分析器分析读取到的采集数据,并将分析结果发给控制器,便于控制器对网络进行配置管理,及时调优网络。
调整网络参数,控制器将网络需要调整的配置下发给设备,配置下发生效后,新的采集数据又会上报到采集器,此时分析器可以分析调优后的网络效果是否符合预期,直到调优完成后,整个业务流程形成闭环。


五.订阅数据的方式有哪些?
订阅数据是Telemetry系统中非常重要的一个环节,有两种订阅机制。
静态订阅,设备作为客户端,采集器作为服务端。由设备主动与采集器建立连接,并向采集器推送采集数据。采集哪些数据,在设备上通过命令行的方式配置。
动态订阅,采集器作为客户端,设备作为服务端,由采集器主动与设备建立连接,并由设备推送采集数据给采集器。采集哪些数据,由采集器下发动态配置给设备。
如果网络设备与采集器之间的连接断开,静态订阅方式下,设备会进行重新连接,再次上送采集数据;动态订阅方式下,设备会取消动态订阅,不再上送采集数据。因此,静态订阅的特点是持续采集和推送,适合订阅需要长期采集的数据,动态订阅的特点是专项采集,按需推送,适合订阅临时需要采集的数据。

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。