- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

AI + 安全：给攻击者“装个跟踪器”，用机器学习揪出所有不正常的家伙

Echo_Wish 发表于 2025/12/06 19:50:21 2025/12/06

【摘要】 AI + 安全：给攻击者“装个跟踪器”，用机器学习揪出所有不正常的家伙

AI + 安全：给攻击者“装个跟踪器”，用机器学习揪出所有不正常的家伙
作者：Echo_Wish｜AI 安全方向自媒体创作者

如果你问我：
“在网络安全这件事上，什么最难？”

我会毫不犹豫地回答：
难就难在你不知道敌人是谁，它又什么时候会动手。

攻击者永远只要成功一次，而防守者必须每次都成功。
但 AI 尤其是 机器学习的异常行为检测（Behavior Anomaly Detection），让这个古老的矛盾第一次有了新的解决方式。

今天这篇文章，我就带你用最接地气也最可操作的方式聊清楚：

为什么传统安全手段越来越不够用
异常行为检测的核心逻辑
机器学习是怎么“看出不对劲的”
怎么构建一套 AI 异常检测系统
给你一段能跑的 Python 示例
我个人在 AI 安全上的一些真实感受

别担心，我们不用枯燥的数学公式，也不用堆砌高深名词。
就像咱们坐在咖啡馆里聊天一样，轻松但不失深度。

一、为什么安全越来越难？因为攻击者“长脑子了”

过去的安全防护靠的是什么？

规则。

某 IP 攻击次数超过 100 → 阻断
URL 带 select * → 可能 SQL 注入
用户连续密码错误 5 次 → 锁定

但现在的攻击者：

会伪装正常行为
会分布式地试探、碎片化攻击
会模拟合法流量
会绕过日志、代理与网关
会用 AI 生成更真实的行为序列

简单说：
过去人类写规则，现在攻击者写 AI。

而规则永远比不上模型学到的模式。
于是，业界开始转向：

不再找“已知攻击模式”，而是找“不正常的行为”。

这，就是异常行为检测。

二、什么是异常行为？一句话就能解释

异常行为的核心不是什么数学模型、概率密度、聚类边界。
它本质上只有一句话：

模型学会“正常是什么”，然后把不像正常的都标红。

比如：

某个员工每天都在 9:00 登录，但今天凌晨 3:14 登录 → 不正常
某台服务器每小时请求量在 3000-5000 波动，突然冲到 30000 → 不正常
某个 API 请求参数始终是数字，突然出现一段加密字符 → 不正常
某设备一直从北京访问，今天突然从南美某地访问 → 不正常

听懂了吧？
检测异常并不是“识别攻击”，而是识别偏离正常的行为模式。

三、机器学习是怎么知道“不正常”的？

很多人误会机器学习是识别攻击特征。
其实更接近：

模型在读一本书，读多了就知道哪句不像人话。

机器学习检测异常主要有三种方法：

方法 1：无监督学习（最常用）

因为大部分企业没有“已标注的攻击样本”。

常见模型：

Isolation Forest（隔离森林）
One-Class SVM
AutoEncoder（自编码器异常检测）
LSTM 时间序列模型

核心思想：

模型只学习“正常数据”，然后把远离正常簇的数据标记为异常。

方法 2：半监督学习

部分异常样本 + 大量正常样本。

方法 3：监督学习

攻击样本丰富时用，典型场景：

恶意流量
恶意 URL
诈骗短信分类

但在行为分析领域，大部分时候是 无监督学习 主导。

四、用一段能跑的 Python 代码让你秒懂异常检测

我们用最常用的 Isolation Forest 做例子。

下面模拟一个简单场景：
“正常用户登录时间为 8:00–20:00，而攻击者从半夜登录。”

import numpy as np
from sklearn.ensemble import IsolationForest
import matplotlib.pyplot as plt

# 构造正常数据（8:00 - 20:00 的登录时间）
normal_hours = np.random.normal(loc=14, scale=2, size=500)  # 模拟 14 点（下午）是高峰

# 构造异常数据（凌晨登录）
abnormal_hours = np.random.uniform(0, 5, size=20)

# 合并数据
data = np.concatenate([normal_hours, abnormal_hours]).reshape(-1, 1)

# 训练模型
model = IsolationForest(contamination=0.05)
model.fit(data)

# 预测
labels = model.predict(data)  # -1 表示异常，1 表示正常

# 可视化
plt.scatter(range(len(data)), data, c=labels, cmap='coolwarm')
plt.title("Login Time Anomaly Detection")
plt.xlabel("sample id")
plt.ylabel("login hour")
plt.show()

如果你运行它，会看到异常点被红色标记出来，就像人群中几个穿着奇怪服装的人被一眼识别出来一样。

这就是机器学习在异常检测上让人上头的地方：
它不是查字典，而是查“你不像正常人”。

五、如何构建一套企业级 AI 异常检测系统？

我把实践经验浓缩成以下 5 步，能落地：

① 数据采集：收集行为轨迹

包括但不限于：

登录时间、地点、设备
API 调用序列
操作点击序列
SSH/数据库访问行为
CPU/IO/进程行为轨迹
网络流量模式

行为越丰富，模型越聪明。

② 数据清洗与特征工程

比如一个登录事件：

字段	说明
hour	登录时间
ip_location	IP 所在地区
device_id	登录设备
is_weekend	是否周末
operate_entropy	行为复杂度
session_duration	会话时长

特征才是决定效果的关键。

③ 选择模型

一般流程：

轻量场景 → Isolation Forest
高维行为 → AutoEncoder
时序行为 → LSTM / Transformer
网络流量 → GNN（图神经网络）

④ 线上实时推理

多数企业采用：

Flink / Spark Streaming 做实时判断
Redis / Kafka 做缓冲
Grafana + 报警系统输出结果

⑤ 自动响应

比如：

异常登录 → MFA 多因子验证
请求量暴涨 → 自动限流
IP 行为异常 → 阻断或高等级审计
API 使用异常 → 自动降级权限

AI 不是用来“看”的，是用来“行动”的。

六、我做 AI 安全时最大的感受：

技术不是最难的，人性才是

你以为最大的挑战是：

模型调参
特征构建
训练稳定性

其实不然。

真正的难点是：企业里没人愿意承担“误报责任”。

异常检测一定会存在误报，但这不是缺点，而是特性：

没有误报的检测系统，不是神，就是没在认真查。

我见过太多企业宁愿不报警，也要保证“零误报”。
但攻击者不这么想，他们不会留情面。
所以 AI 安全真正的问题变成：

允许多少误报？
如何用流程兜住风险？
如何让安全团队信任模型？
如何让模型在风险、体验之间找到平衡？

这是技术之外的挑战。
但我始终相信一件事：

在“攻守对抗”这件事情上，AI 是第一次让防守方获得主动权的武器。

七、结语：给安全装上“第六感”的时代到了

过去的安全策略像“黑名单+硬规则”。
像城墙，死硬，但不灵活。

AI 异常检测像“守城侦察兵 + 嗅觉犬”。
它能提前发现不对劲，给你时间反应。

我坚定相信：

未来的安全系统一定是 AI 驱动，而人类只是审判者。

我是 Echo_Wish，

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

AI + 安全：给攻击者“装个跟踪器”，用机器学习揪出所有不正常的家伙

一、为什么安全越来越难？因为攻击者“长脑子了”

二、什么是异常行为？一句话就能解释

三、机器学习是怎么知道“不正常”的？

方法 1：无监督学习（最常用）

方法 2：半监督学习

方法 3：监督学习

四、用一段能跑的 Python 代码让你秒懂异常检测

五、如何构建一套企业级 AI 异常检测系统？

① 数据采集：收集行为轨迹

② 数据清洗与特征工程

③ 选择模型

④ 线上实时推理

⑤ 自动响应

六、我做 AI 安全时最大的感受：

技术不是最难的，人性才是

七、结语：给安全装上“第六感”的时代到了

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

AI + 安全：给攻击者“装个跟踪器”，用机器学习揪出所有不正常的家伙

一、为什么安全越来越难？因为攻击者“长脑子了”

二、什么是异常行为？一句话就能解释

三、机器学习是怎么知道“不正常”的？

方法 1：无监督学习（最常用）

方法 2：半监督学习

方法 3：监督学习

四、用一段能跑的 Python 代码让你秒懂异常检测

五、如何构建一套企业级 AI 异常检测系统？

① 数据采集：收集行为轨迹

② 数据清洗与特征工程

③ 选择模型

④ 线上实时推理

⑤ 自动响应

六、我做 AI 安全时最大的感受：

技术不是最难的，人性才是

七、结语：给安全装上“第六感”的时代到了

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品