根因分析——KPI根因关联分析检测

举报
就挺突然 发表于 2021/07/29 23:20:30 2021/07/29
【摘要】 from naie.rca import KpiCorrDetector, BaseSettings, DataInfo, AdvanceSettings from naie.datasets import data_reference from naie.context import Context as context根据数据集名称创建DataReference对象data...
from naie.rca import KpiCorrDetector, BaseSettings, DataInfo, AdvanceSettings
from naie.datasets import data_reference
from naie.context import Context as context

根据数据集名称创建DataReference对象

dataset = 'network'
dataset_entity = 'kpi' 
datareference = data_reference.get_data_reference(dataset=dataset, dataset_entity=dataset_entity)

数据预处理,删除不必要的特征列

df = datareference.to_pandas_dataframe()
df = df.drop("timestamp", axis=1)

配置KpiCorrDetector 基础参数

参数:

  • business_kpi: 主KPI的名称,str类型,必选
  • error_kpi: 关联KPI名称列表,list类型, 可选
  • history_size: 关联检测使用的历史窗口大小,可选,默认一天,使用字典格式, key包含有"days", "seconds", "microseconds", "milliseconds", "minutes", "hours", "weeks", 例如:{"days":2.0, "hours":12}
base_settings = BaseSettings(business_kpi="335655482")

配置KpiCorrDetector 高级参数(可选)

参数:

  • sim_max_shift: 最大的窗口移动距离,int类型,可选,默认值为-1
  • missing_filler: 缺失值处理方式,必须是'zero'或'linear'或'adaptive',可选,默认为'adaptive'
  • trend_removal: 数据趋势处理方式,必须是None或'gradient'或'diff',可选,默认为None
  • noise_removal: 数据噪声是否处理,bool类型,可选,默认为False
  • outlier_detector: 奇异值检测方法,必须是None, 'mad', 'std',可选,默认为None
  • outlier_filler: 奇异值填充方式,必须是'thresholding'或'filling',可选,默认为'filling'
  • n_cpus: 根因检测计算使用的cpu数,int 类型,可选,默认为-1
  • fp_filter_cutoff: 波动特征高通过滤的阈值,int 类型,负值表示不使用高通过滤,可选,默认为-1
  • fp_amplify_feature: 波动特征是否进行特征放大处理,bool类型,可选,默认为False
  • sim_metric: 相似性计算函数,必须是'normxcorr','bivariate_granger', 'spearmanr', 'kendalltau', 'pearsonr',可选,默认为'normxcorr'
  • sim_positive_shift: 关联KPI是否只支持右移,bool类型,可选,默认为False
  • sim_enforce_sign: 是否使用KPI类型来计算相似信息, bool类型,可选,默认为False


advance_setting = AdvanceSettings()

配置检测数据相关信息

参数:

  • index_col:数据集中对应的时间列名, 必选,str类型
  • present_time:检测数据的截至时间,格式为"yyyy-mm-dd HH:MM:SS", 必选,str类型
  • anomaly_time:检测数据的异常时间,格式为"yyyy-mm-dd HH:MM:SS", 可选,str类型
data_info = DataInfo(index_col="format_time", present_time="2019-12-06 16:55:00")

使用KpiCorrDetetor进行根因分析检测

detector = KpiCorrDetector(base_settings, advance_setting)
ret = detector.detect(data=df, data_info=data_info)

100%|███████████████| 6/6 [00:01<00:00, 6.04it/s]

Ranked list of correlated L3 KPIs:

 KPI  Type Shift Score  AScore CScore Feature names
 335655477  None   0   -0.545142 1.0 -0.545142  SpectralSaliency - SpectralSaliency
 335655640  None -53   -0.532937 1.0 -0.532937  SpectralSaliency - SpectralSaliency
 335655475  None  -1   -0.486732 1.0 -0.486732  SpectralSaliency - SpectralSaliency
 335655473  None -53   -0.359917 1.0 -0.359917  SpectralSaliency - SpectralSaliency
 335655476  None -53   -0.344594 1.0 -0.344594  SpectralSaliency - SpectralSaliency




NAIE SDK帮助文档汇总请参考:

网络人工智能园地:NAIE SDK帮助文档汇总 zhuanlan.zhihu.com图标


文章来源: zhuanlan.zhihu.com,作者:网络人工智能园地,版权归原作者所有,如需转载,请联系作者。

原文链接:zhuanlan.zhihu.com/p/382227352

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。