HC2020 NAIE大咖面对面(3)——岳大炯《网络KPI之时序预测与异常检测----在线自监督等学习机制与集成》
本次“华为全联接2020”们特别请来了华为NAIE首席AI架构师、NAIE算法专家——岳大炯先生,和大家面对面分享交流网络KPI之时序预测与异常检测——在线自监督等学习机制与集成。
各种通讯系统中,大量的软硬件模块,出于业务、性能、故障等监控的目的,产生并采集了大量与时间相关的各种指标数据。
通讯网络中的数据,主要包含:
性能指标:时序数据,浮点数值
告警数据:半结构化,半标准化,文本
各种静态配置:形式不定
基于这些数据,可以实现各种能力,如预测,异常检测等,并提供为有价值的服务:比如基于预测实现:流量预测、用户预测辅助容量规划,设备节能,客户流失管理;基于异常预测实现:故障预警、故障发现、故障关联过滤,辅助修复等,减少业务损失和人力投入。
另外还有一类主要的数据:各种拓扑数据。
在通讯系统智能化的实践中,如果能有效利用拓扑数据,在各种应用场景,比如故障检测、关联、修复、根因分析,都非常有用。
但是,拓扑数据在通讯系统中,可能是不同层的,偏底层/物理层的拓扑相对静态,而偏上层/逻辑层的拓扑可能快速动态变化。
这就需要我们对时序预测与异常检测有一定的了解:
什么是时序?
什么是时序预测(Time Series Prediction)?
时序预测,是根据一定长度历史时序,预测将来一步到多步的时间点的时序数值。
什么是时序异常检测(Time Series Anomaly Detection)
时序异常检测,是从一条或多条时序中,独立或者关联,识别出显著不同于其他大多数的少数疑似点。
乍看之下,时序数据的异常检测,输入数据形式简单,任务也很明确,一般情况输入的数量也很小,很容易设计各种算法来做异常检测,而且有不同类型的大量异常检测算法可以直接使用或者改进使用。
事实上,要实现一个(套)综合能力强大,能很好的适合通讯领域的要求的时序数据异常检测算法,挑战非常大。维护高度一致、实时,甚至多个历史版本的拓扑,其代价又很高。
这些挑战,有何策略可以应对或者缓解呢?
1)技术方案/算法,能够容忍一定程度的不一致;
2)对拓扑能做一定程度的抽象,不要过分依赖实例;
3)对于不一致性,可以采用推理后二次确认;
4)工程实现上,采用按需更新部分拓扑减少更新代价等。
如果你对本话题感兴趣,欢迎莅临“华为2020全联接”,与专家面对面沟通交流。
也可直接在本文下方评论区留言提出你的问题、发表你的观点、阐述你的理解,我们将挑选高赞回答赠送《迁移学习》一本。
- 点赞
- 收藏
- 关注作者
评论(0)