PySpider HTTP 599: SSL certificate problem 错误的解决方法

举报
崔庆才丨静觅 发表于 2021/05/22 00:23:47 2021/05/22
【摘要】 前言 最近发现许多小伙伴在用 PySpider 爬取 https 开头的网站的时候遇到了 HTTP 599: SSL certificate problem: self signed certificate in certificate chain 的错误。 经过一番排查,解决方案总结如下 错误原因 这个错误会发生在请求 https 开头的网址,SSL 验证错误,证书有误。...

前言

最近发现许多小伙伴在用 PySpider 爬取 https 开头的网站的时候遇到了 HTTP 599: SSL certificate problem: self signed certificate in certificate chain 的错误。 经过一番排查,解决方案总结如下

错误原因

这个错误会发生在请求 https 开头的网址,SSL 验证错误,证书有误。 报错如下 pGIhFsz_png

解决方案

最简单的解决方法是: 在 crawl 方法中加入忽略证书验证的参数,validate_cert=False,即

1
self.crawl(url, callback=method_name, validate_cert=False)

以上方法基本可以解决问题。 如果出现了

1
[E 160329 14:00:56 base_handler:194] crawl() got unexpected keyword argument: ['validate_cert']

的错误,即无法匹配到 validate_cert 参数,那么则是 PySpider 本身的问题。 目前的最新发行版是 0.3.6(2016/3/29),不过 GitHub 最新版本目前是 0.4.0 可以更新到最新版本,即更新到 master 分支。 因为包还没有发行,所以我们就手动来更新。 PySpider 可以点击右侧下载 zip 包。 QQ20160329-0@2x

Mac OS X

以 Mac OS X 为例,找到 pyspider 库所在的路径。我的是在

1
/Library/Python/2.7/site-packages/pyspider

打开之后发现如下的结构。 QQ20160329-1@2x 把刚才的包下载下来之后,解压缩,打开文件夹,发现目录结构是这样的。 QQ20160329-2@2x 然后进入 pyspider 文件夹,观察一下,发现和我们之前安装的 pyspider 目录结构是一样的,没错,就是它了! QQ20160329-3@2x 嗯,把所有的文件都更新到 site-packages/pyspider 目录中。 可以手动拖动替换,可以使用命令

1
2
cd pyspider
sudo python setup.py install

更新之后,然后重新启动 pyspider 。

1
pyspider all

再加入 validate_cert=False 参数,发现就不会出现刚才的问题了。

Linux

方法同上,pyspider 路径应该在

1
/usr/lib/python/site-packages/pyspider-0.3.6.egg/pyspider

替换一下下载下来的文件。 同样也可以使用命令

1
2
cd pyspider
sudo python setup.py install

Windows

方法同上,pyspider 路径应该在

1
python(python安装目录)/Lib/site-packages/pyspider

同样替换下载下来的文件即可。 命令同上

1
2
cd pyspider
sudo python setup.py install

结语

通过以上配置,我们解决了 PySpider 的 599 错误以及 validate_cert 参数不匹配的问题。 希望对大家有帮助!

文章来源: cuiqingcai.com,作者:崔庆才,版权归原作者所有,如需转载,请联系作者。

原文链接:cuiqingcai.com/2703.html

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。