根因分析——KPI根因关联分析检测
【摘要】 from naie.rca import KpiCorrDetector, BaseSettings, DataInfo, AdvanceSettings
from naie.datasets import data_reference
from naie.context import Context as context根据数据集名称创建DataReference对象data...
from naie.rca import KpiCorrDetector, BaseSettings, DataInfo, AdvanceSettings
from naie.datasets import data_reference
from naie.context import Context as context
根据数据集名称创建DataReference对象
dataset = 'network'
dataset_entity = 'kpi'
datareference = data_reference.get_data_reference(dataset=dataset, dataset_entity=dataset_entity)
数据预处理,删除不必要的特征列
df = datareference.to_pandas_dataframe()
df = df.drop("timestamp", axis=1)
配置KpiCorrDetector 基础参数
参数:
- business_kpi: 主KPI的名称,str类型,必选
- error_kpi: 关联KPI名称列表,list类型, 可选
- history_size: 关联检测使用的历史窗口大小,可选,默认一天,使用字典格式, key包含有"days", "seconds", "microseconds", "milliseconds", "minutes", "hours", "weeks", 例如:{"days":2.0, "hours":12}
base_settings = BaseSettings(business_kpi="335655482")
配置KpiCorrDetector 高级参数(可选)
参数:
- sim_max_shift: 最大的窗口移动距离,int类型,可选,默认值为-1
- missing_filler: 缺失值处理方式,必须是'zero'或'linear'或'adaptive',可选,默认为'adaptive'
- trend_removal: 数据趋势处理方式,必须是None或'gradient'或'diff',可选,默认为None
- noise_removal: 数据噪声是否处理,bool类型,可选,默认为False
- outlier_detector: 奇异值检测方法,必须是None, 'mad', 'std',可选,默认为None
- outlier_filler: 奇异值填充方式,必须是'thresholding'或'filling',可选,默认为'filling'
- n_cpus: 根因检测计算使用的cpu数,int 类型,可选,默认为-1
- fp_filter_cutoff: 波动特征高通过滤的阈值,int 类型,负值表示不使用高通过滤,可选,默认为-1
- fp_amplify_feature: 波动特征是否进行特征放大处理,bool类型,可选,默认为False
- sim_metric: 相似性计算函数,必须是'normxcorr','bivariate_granger', 'spearmanr', 'kendalltau', 'pearsonr',可选,默认为'normxcorr'
- sim_positive_shift: 关联KPI是否只支持右移,bool类型,可选,默认为False
- sim_enforce_sign: 是否使用KPI类型来计算相似信息, bool类型,可选,默认为False
advance_setting = AdvanceSettings()
配置检测数据相关信息
参数:
- index_col:数据集中对应的时间列名, 必选,str类型
- present_time:检测数据的截至时间,格式为"yyyy-mm-dd HH:MM:SS", 必选,str类型
- anomaly_time:检测数据的异常时间,格式为"yyyy-mm-dd HH:MM:SS", 可选,str类型
data_info = DataInfo(index_col="format_time", present_time="2019-12-06 16:55:00")
使用KpiCorrDetetor进行根因分析检测
detector = KpiCorrDetector(base_settings, advance_setting)
ret = detector.detect(data=df, data_info=data_info)
100%|███████████████| 6/6 [00:01<00:00, 6.04it/s]
Ranked list of correlated L3 KPIs:
KPI Type Shift Score AScore CScore Feature names
335655477 None 0 -0.545142 1.0 -0.545142 SpectralSaliency - SpectralSaliency
335655640 None -53 -0.532937 1.0 -0.532937 SpectralSaliency - SpectralSaliency
335655475 None -1 -0.486732 1.0 -0.486732 SpectralSaliency - SpectralSaliency
335655473 None -53 -0.359917 1.0 -0.359917 SpectralSaliency - SpectralSaliency
335655476 None -53 -0.344594 1.0 -0.344594 SpectralSaliency - SpectralSaliency
NAIE SDK帮助文档汇总请参考:
网络人工智能园地:NAIE SDK帮助文档汇总
文章来源: zhuanlan.zhihu.com,作者:网络人工智能园地,版权归原作者所有,如需转载,请联系作者。
原文链接:zhuanlan.zhihu.com/p/382227352
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)