scrapy下的一些常见错误处理

举报
~大鱼~ 发表于 2021/05/28 01:48:32 2021/05/28
【摘要】 常见的一些小错误分类处理 内部错误 逻辑错误 其它错误 内部错误 TypeError 表现形式:TypeError: ‘float’ object is not iterable 相关搜索:https://github.com/scrapy/scrapy/issues/2461 解决方法:sudo pip install -U Twisted==16.6.0 ER...

常见的一些小错误分类处理

  • 内部错误
  • 逻辑错误
  • 其它错误

内部错误

  • TypeError
    • 表现形式:TypeError: ‘float’ object is not iterable
    • 相关搜索:https://github.com/scrapy/scrapy/issues/2461
    • 解决方法:sudo pip install -U Twisted==16.6.0
  • ERROR: Unable to read the instance data ,giving up
    • 表现形式: 直接error 报错,拿不到数据
    • 相关搜索: 无
    • 解决方法: 回调函数中,必须返回 Request 对象 或者Item对象 ,可以直接返回这种类型的数据就可以了
  • Library not loaded: /opt/local/lib/libssl.1.0.0.dylib (LoadError)
    • 解决方法: brew remove openssl 先卸载,然后 brew install openssl
  • unknown command: crawl error
    • 表现形式: 无法使用crawl 命令
    • 相关搜索 : unknown-command-crawl-error
    • 解决方法 : 切换到有scrapy.cfg文件下,然后使用命令

周边错误

  • scrapyd run spider 出现 TypeError: __init__() got an unexpected keyword argument ‘_job
    • spider 的init函数 需要改成 __init__(*args,**kwargs)
    • 相关搜索: https://github.com/scrapy/scrapyd/issues/78

文章来源: brucedone.com,作者:大鱼的鱼塘,版权归原作者所有,如需转载,请联系作者。

原文链接:brucedone.com/archives/955

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。