- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

[Python3 网络爬虫开发实战] 1.9.4-Scrapyd API 的安装

崔庆才丨静觅发表于 2021/05/21 23:43:20 2021/05/21

【摘要】安装好了 Scrapyd 之后，我们可以直接请求它提供的 API 来获取当前主机的 Scrapy 任务运行状况。比如，某台主机的 IP 为 192.168.1.1，则可以直接运行如下命令获取当前主机的所有 Scrapy 项目： 1 curl http://localhost:6800/listprojects.json 运行结果如下： 1 {...

安装好了 Scrapyd 之后，我们可以直接请求它提供的 API 来获取当前主机的 Scrapy 任务运行状况。比如，某台主机的 IP 为 192.168.1.1，则可以直接运行如下命令获取当前主机的所有 Scrapy 项目：

   
      curl http://localhost:6800/listprojects.json

运行结果如下：

   
      {"status": "ok", "projects": ["myproject", "otherproject"]}

返回结果是 JSON 字符串，通过解析这个字符串，便可以得到当前主机的所有项目。

但是用这种方式来获取任务状态还是有点烦琐，所以 Scrapyd API 就为它做了一层封装，下面我们来看下它的安装方式。

1. 相关链接

GitHub：https://pypi.python.org/pypi/python-scrapyd-api/
PyPI：https://pypi.python.org/pypi/python-scrapyd-api
官方文档：http://python-scrapyd-api.readthedocs.io/en/latest/usage.html

2. pip 安装

这里推荐使用 pip 安装，命令如下：

   
      pip install python-scrapyd-api

3. 验证安装

安装完成之后，便可以使用 Python 来获取主机状态了，所以上面的操作便可以用 Python 代码实现：

   
      from scrapyd_api import ScrapydAPI
scrapyd = ScrapydAPI('http://localhost:6800')
print(scrapyd.list_projects())

运行结果如下：

   
      ["myproject", "otherproject"]

这样我们便可以用 Python 直接来获取各个主机上 Scrapy 任务的运行状态了。

文章来源: cuiqingcai.com，作者：崔庆才，版权归原作者所有，如需转载，请联系作者。

原文链接：cuiqingcai.com/5453.html

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

[Python3 网络爬虫开发实战] 1.9.4-Scrapyd API 的安装

1. 相关链接

2. pip 安装

3. 验证安装

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

[Python3 网络爬虫开发实战] 1.9.4-Scrapyd API 的安装

1. 相关链接

2. pip 安装

3. 验证安装

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

推荐阅读

相关产品