Crawler之Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息

举报
一个处女座的程序猿 发表于 2021/03/28 02:48:06 2021/03/28
【摘要】 Crawler之Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息     目录 输出结果 实现代码       输出结果 后期更新……     实现代码 import scrapyclass DmozSpider(scrapy.Spider): na...

Crawler之Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息

 

 

目录

输出结果

实现代码


 

 

 

输出结果

后期更新……

 

 

实现代码


  
  1. import scrapy
  2. class DmozSpider(scrapy.Spider):
  3. name ="dmoz"
  4. allowed_domains = ["dmoz.org"]
  5. start_urls = [
  6. "https://dmoztools.net/Computers/Programming/Languages/Python/Resources/"
  7. "https://dmoztools.net/Computers/Programming/Languages/Python/Books/"
  8. ]
  9. def parse(self,response):
  10. filename = response.url.split("/")[-2]
  11. with open(filename, 'wb') as f:
  12. f.write(response.body)

 

 

相关文章
Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息

 

文章来源: yunyaniu.blog.csdn.net,作者:一个处女座的程序猿,版权归原作者所有,如需转载,请联系作者。

原文链接:yunyaniu.blog.csdn.net/article/details/79596751

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。