Python爬虫入门教程 79-100 Python Portia爬虫框架-在Win7里面配置起来

举报
梦想橡皮擦 发表于 2021/05/26 22:59:36 2021/05/26
【摘要】 写在前面 曾经有人问我,为何要写100篇关于爬虫的博客?我想说,因为吹牛吹过头了呗,100篇是真的难写。 希望在未来爬虫100例系列博客能在Python爬虫教学领域有那么一点点的位置。 今天开始,我将从一些成熟框架入手,继续提高你的爬虫知识面。 Portia是啥? 这个框架在最开始就计划写一下了,没想到拖到这里,Portia属于可视化爬虫,基本描述参照下述内容...

写在前面

曾经有人问我,为何要写100篇关于爬虫的博客?我想说,因为吹牛吹过头了呗,100篇是真的难写。

希望在未来爬虫100例系列博客能在Python爬虫教学领域有那么一点点的位置。

今天开始,我将从一些成熟框架入手,继续提高你的爬虫知识面。

Portia是啥?

这个框架在最开始就计划写一下了,没想到拖到这里,Portia属于可视化爬虫,基本描述参照下述内容

Portia is a tool that allows you to visually scrape websites without any programming knowledge required. With Portia you can annotate a web page to identify the data you wish to extract, and Portia will understand based on these annotations how to scrape data from similar pages.

大意是:Portia是一个工具,它允许你在不需要任何编程知识的情况下可视化地抓取网站。看来是不用写代码就可以操作了,不过后面的实操告诉我,没那么简单~

github地址:https://github.com/scrapinghub/portia
文档地址:https://portia.readthedocs.io/en/2.0-docs/

文章来源: dream.blog.csdn.net,作者:梦想橡皮擦,版权归原作者所有,如需转载,请联系作者。

原文链接:dream.blog.csdn.net/article/details/108239023

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。