Crawler之Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息
【摘要】 Crawler之Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息
目录
输出结果
实现代码
输出结果
后期更新……
实现代码
import scrapyclass DmozSpider(scrapy.Spider): na...
Crawler之Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息
目录
输出结果
后期更新……
实现代码
-
import scrapy
-
class DmozSpider(scrapy.Spider):
-
name ="dmoz"
-
allowed_domains = ["dmoz.org"]
-
start_urls = [
-
"https://dmoztools.net/Computers/Programming/Languages/Python/Resources/"
-
"https://dmoztools.net/Computers/Programming/Languages/Python/Books/"
-
]
-
def parse(self,response):
-
filename = response.url.split("/")[-2]
-
with open(filename, 'wb') as f:
-
f.write(response.body)
相关文章
Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息
文章来源: yunyaniu.blog.csdn.net,作者:一个处女座的程序猿,版权归原作者所有,如需转载,请联系作者。
原文链接:yunyaniu.blog.csdn.net/article/details/79596751
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)