- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Crawler：基于urllib库+实现爬虫有道翻译

一个处女座的程序猿发表于 2021/03/28 03:32:05 2021/03/28

【摘要】 Crawler：基于urllib库+实现爬虫有道翻译目录输出结果设计思路实现步骤输出结果后期更新…… 设计思路第一步：首先要知道，data里面的内容是都需要在代码中发送给服务器的。第二步：理解反爬虫机制，找出加密参数。大多数网站的反爬虫的机制是对向服务器提交表单的动态值进行加密，所以，我们每翻译一...

输出结果

设计思路

实现步骤

输出结果

后期更新……

设计思路

第一步：首先要知道，data里面的内容是都需要在代码中发送给服务器的。
第二步：理解反爬虫机制，找出加密参数。大多数网站的反爬虫的机制是对向服务器提交表单的动态值进行加密，所以，我们每翻译一次，就观察data里面有哪些参数是动态变化的。从这个网址来看，参数salt、sign对应的值是动态变化。
第三步：找出动态参数的实现方式。根据反爬虫经验可知，一般网站生成的反爬加密值都是采用的时间戳，以及将一下字符串使用加密算法加密一下，我们可以从网页源代码中进行查找理解。