Crawler之Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息

举报
一个处女座的程序猿 发表于 2021/03/28 02:48:06 2021/03/28
2.9k+ 0 0
【摘要】 Crawler之Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息     目录 输出结果 实现代码       输出结果 后期更新……     实现代码 import scrapyclass DmozSpider(scrapy.Spider): na...

Crawler之Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息

目录

输出结果

实现代码


输出结果

后期更新……

实现代码


      import scrapy
      class DmozSpider(scrapy.Spider):
       name ="dmoz"
       allowed_domains = ["dmoz.org"]
       start_urls = [
      "https://dmoztools.net/Computers/Programming/Languages/Python/Resources/"
      "https://dmoztools.net/Computers/Programming/Languages/Python/Books/"
       ]
      def parse(self,response):
       filename = response.url.split("/")[-2]
      with open(filename, 'wb') as f:
       f.write(response.body)
  
 

相关文章
Scrapy:Python实现scrapy框架爬虫两个网址下载网页内容信息

文章来源: yunyaniu.blog.csdn.net,作者:一个处女座的程序猿,版权归原作者所有,如需转载,请联系作者。

原文链接:yunyaniu.blog.csdn.net/article/details/79596751

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

作者其他文章

评论(0

抱歉,系统识别当前为高风险访问,暂不支持该操作

    全部回复

    上滑加载中

    设置昵称

    在此一键设置昵称,即可参与社区互动!

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。