爬虫平台Crawlab v0.2发布
【摘要】 Crawlab是一个专注于爬虫的集成了爬虫管理、任务调度、任务监控、数据分析等模块的分布式爬虫管理平台,非常适合对爬虫管理、爬虫工程化有要求的开发者及企业。对Crawlab还不了解的童鞋,请移步之前的文章:[爬虫手记] 我是如何在3分钟内开发完一个爬虫的爬虫平台Crawlab v0.2发布分布式通用爬虫管理平台Crawlab手把手教你如何用Crawlab构建技术文章聚合平台(一)手把手教你如...
![](https://res.hc-cdn.com/ecology/9.3.157/v2_resources/ydcomm/libs/images/loading.gif)
Crawlab是一个专注于爬虫的集成了爬虫管理、任务调度、任务监控、数据分析等模块的分布式爬虫管理平台,非常适合对爬虫管理、爬虫工程化有要求的开发者及企业。对Crawlab还不了解的童鞋,请移步之前的文章:
-
[爬虫手记] 我是如何在3分钟内开发完一个爬虫的 -
爬虫平台Crawlab v0.2发布 -
分布式通用爬虫管理平台Crawlab -
手把手教你如何用Crawlab构建技术文章聚合平台(一) -
手把手教你如何用Crawlab构建技术文章聚合平台(二)
Crawlab的任务调度核心模块是基于Celery的,因此天然支持分布式爬虫、多节点抓取。Crawlab虽然是用python写的,但爬虫不局限于python爬虫,理论上可兼容任何语言以及任何框架。从目前开源的框架来看,大部分爬虫平台是以scrapyd为核心,因此只能支持scrapy框架的爬虫,而Crawlab不仅支持scrapy,还支持其他框架的爬虫。
更新一览
v0.2 已完成
-
[x] 基础统计 -
[x] 数据分析(爬虫) -
[x] 网站信息 -
[x] 定时任务 -
[x] 修复bug
待开发
-
[ ] 用户管理 -
[ ] 上传爬虫 -
[ ] 导出数据 -
[ ] 高级数据分析(网站、任务) -
[ ] 更多爬虫例子 -
[ ] 文件管理
截屏
基础统计(爬虫)
![](https://res.hc-cdn.com/ecology/9.3.157/v2_resources/ydcomm/libs/images/loading.gif)
基础统计(任务)
![](https://res.hc-cdn.com/ecology/9.3.157/v2_resources/ydcomm/libs/images/loading.gif)
定时任务
网站信息
![](https://res.hc-cdn.com/ecology/9.3.157/v2_resources/ydcomm/libs/images/loading.gif)
Github: tikazyq/crawlab
【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)