- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

从免费的物联网防火墙hihttps谈机器学习之样本采集

himqtt 发表于 2020/02/12 17:50:29 2020/02/12

【摘要】 hihttps是首款免费的MQTT物联网防火墙，同时也是一款web应用防火墙，既支持传统的WAF的OWASP特征工程检查（如SQL注入、XSS、恶意漏洞扫描、密码暴力破解、CC、DDOS等），也支持机器采集样本无监督学习，自主对抗，重新定义网络安全。今天笔者就从物联网MQTT协议安全的角度，介绍机器学习之样本采集。一、究竟什么是MQTT攻击？MQTT是物联网loT最广泛采用的协...

hihttps是首款免费的MQTT物联网防火墙，同时也是一款web应用防火墙，既支持传统的WAF的OWASP特征工程检查（如SQL注入、XSS、恶意漏洞扫描、密码暴力破解、CC、DDOS等），也支持机器采集样本无监督学习，自主对抗，重新定义网络安全。今天笔者就从物联网MQTT协议安全的角度，介绍机器学习之样本采集。

一、究竟什么是MQTT攻击？

MQTT是物联网loT最广泛采用的协议，腾讯百度阿里云都支持，基础协议请百度搜索“物联网防火墙himqtt源码之MQTT协议分析”。在PUBLISH发布和主题订阅SUBSCRIBLE指令中，json是物联网最常用的通信格式，如：

{

"topic": "hihttps/read",

"payload1": {"user=123’ or 1=’1": 888},

"payload2": {"id=456”},

"code": 4200

}

网络安全专家通常认为：MQTT协议攻击很多是有其特殊的特征，SQL注入如user=123' or 1='1、XSS攻击如user=<script>alert(1);</script>等，这类攻击确实有非常典型的特征。上面payload1认为是一个攻击，那么payload2呢，肯定就无法判断了。

再进一步，如果物联网服务器上根本没有hihttps这个接口，那就是恶意行为，一定要检测出来并阻断。但传统的方法肯定不行了，那么机器学习将是唯一的办法。

二、机器学习重新定义网络安全

和图形图像的机器学习相比，物联网安全采集样本的成本是最低的，因为只要把软件在服务器上运行即可采集，甚至读取日志文件，就可以拿到大量的样本，而成本几乎是0。

但物联网领域黑客攻击样本太稀缺了，根本无法拿完并且日新月异，从这个角度也可以说无监督或者半监督学习，才是未来物联网安全的发展方向。下面举例：

如果从mqtt服务器上hihttps/read 的接口中"payload2": {"id=456”},，采集到的样本参数大于99.9%都是“?id=数字”这种形态，那么可以认为下面的载荷都视为攻击：

"payload2": {"id=456 or 1='1”}

"payload2": {"id=456 =<script>alert(1);</script>”}

"payload2": {"id=456&t=123”}

"payload2": {"id=%&”}

后面两条，在传统的waf是不可能检测的，只有机器学习才能准确检测出攻击。所以机器学习的核心是：不是我服务器上的东西，都视为非法攻击，这样有可能阻止未知漏洞和未知攻击。这样，物联网安全的概念和传统的特征工程完全不一样了，机器学习重新定义了网络安全。

三、样本采集原则

1、足够的随机化，在不同的IP地址之间随机采集。

2、足够多的样本，保证99.99%的正确率，至少需要采集数万份的样本。

3、足够的时间，至少在不同的时间段采集3-7天的样本。

4、尽量是正常流量，样本没有***客攻击污染。

5、完整的数据，样本包括全部的MQTT 请求头和body。

所以从日志里面来读取样本数据是有限的，最好用WAF实际部署方式来采集。对于SSL加密的样本采集通常用反向代理方式采集，可以参考hihttps源码https://github.com/qq4108863

四、总结

1、现在对物联网设备攻击都基于逻辑漏洞进行APT攻击，就是高级持续威胁，传统的waf规则很难对付未知漏洞和未知攻击。

2、让机器像人一样学习，具有一定智能自动对抗APT攻击或许是唯一有效途径。但黑客技术本身就是人类最顶尖智力的较量，物联网安全仍然任重而道远。

3、幸好hihttps这类免费的物联网防火墙在机器学习、自主对抗中开了很好一个头，未来物联网安全很可能是特征工程+机器学习共同完成，笔者将在下一篇文章中介绍怎么从MQTT样本中提取特征，自动生成对抗规则，未来物联网安全必然是AI的天下。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

从免费的物联网防火墙hihttps谈机器学习之样本采集

一、究竟什么是MQTT攻击？

二、机器学习重新定义网络安全

三、样本采集原则

四、总结

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

从免费的物联网防火墙hihttps谈机器学习之样本采集

一、 究竟什么是MQTT攻击？

二、 机器学习重新定义网络安全

三、 样本采集原则

四、总结

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品

一、究竟什么是MQTT攻击？

二、机器学习重新定义网络安全

三、样本采集原则