- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

写网络爬虫的法律边界

G-washington 发表于 2019/09/04 11:43:48 2019/09/04

【摘要】目前我国法律是偏向数据拥有者的，如果数据拥有着者有证据向法院起诉的话，抓取数据的一方多半会败诉。另外在抓取过程中，如果破解/反编译对方客户端、软件，破解加密算法，比如你抓某APP数据，去反编译他的客户端，这绝对是犯法，这是破坏计算机信息系统罪。爬虫有风险，开爬要谨慎。

来交代一下，你抓了多少数据，在哪抓的，干什么用了，看够在里面待几年。

从去年开始我看到好几起因为抓取数据而遭遇诉讼，有的锒铛入狱，有的被处罚金，从案件的模糊描述来看，我看得后背发凉，似乎每个爬虫选手都有被KO的风险。

这几个月也停止了几个抓取工作，把有关的法律和新闻认真看了几遍，写了如下文章。

PS：这里讨论的是网络爬虫技术本身，爬虫技术的手法可以用来抓群数据，还可以做其它事情，比如登录社交账号自动发帖，比如刷搜索排名等等。

《刑法》对网络爬虫的定罪依据

《刑法》第 285 条，非法获取计算机信息系统数据罪。

获取该计算机信息系统中存储、处理或者传输的数据，或者对该计算机信息系统实施非法控制，

处三年以下有期徒刑或者拘役，并处或者单处罚金; 最高处七年有期徒刑并处罚金。

《刑法》第285条是对爬取数据的主要定罪依据，有兴趣可以去查下中华人民共和国刑法。

定罪的几个案例：

从已有案例来看有以下几种情况：
1.数据拥有者有证据能够举证你的数据是抓取来的。如下，今日头条对起诉上海晟品法院宣判结果。

图片文字来自中国判决文书网。

从文书描述来看，修改UA，修改device id，绕开网站访问频率控制这是写爬虫的基本，这些手法反而成为了获罪的依据。

2.用户社交数据，尤其是用户隐私相关。

图片文字来自新浪网

3.扰乱对方网站经营规则，且牟利。比如这个：

图片文字来自中国永嘉公号

图上描述做搜索引擎排名的技术，其实就是利用爬虫技术规模化的访问网页。

在我们通常的认知里，因为互联网推崇分享精神，所以认为只要是网络公开数据就可以抓取，但是通过上面的案例来看，

有几个禁忌，抓取的数据最好不要直接商用，涉及社交信息/用户信息要谨慎，老板交代你抓取敏感任务时，让老板先看下刑法第285条。

这不代表个人行为就没事，只是还没入他们的法眼。

在数据抓取这方面，美国也有一个判决案例，美国一家小公司向法院起诉Linkedin，理由是Linkedin通过技术手段阻止他抓取Linkedin上的数据，
而且法院判定这家公司胜诉，裁定Linkedin不准屏蔽这家公司的抓取行为。

目前我国法律是偏向数据拥有者的，如果数据拥有着者有证据向法院起诉的话，抓取数据的一方多半会败诉。

另外在抓取过程中，如果破解/反编译对方客户端、软件，破解加密算法，

比如你抓某APP数据，去反编译他的客户端，这绝对是犯法，这是破坏计算机信息系统罪。

爬虫有风险，开爬要谨慎。

小编评语：没想到就是爬了公开的都有可能获罪，看学法律的那些砖家怎么制定了

本文转载自异步社区

原文链接：

https://www.epubit.com/articleDetails?id=N86eec0a0-0b37-43d1-a174-6ba216aec4c2

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

写网络爬虫的法律边界

《刑法》对网络爬虫的定罪依据

定罪的几个案例：

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

写网络爬虫的法律边界

《刑法》对网络爬虫的定罪依据

定罪的几个案例：

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品