python爬虫五:博客搜索

举报
用户已注销 发表于 2022/07/25 00:06:49 2022/07/25
955 0 0
【摘要】 csdn这两年的搜索功能大为改进,但还是不尽如人意。 所以我写了个在我所有博客中搜索一个字符串的程序: import urllib.request dst = "priority_queue"f = open('D:\\csdn.txt', 'r', encoding='utf-8')for each in f: # p...

csdn这两年的搜索功能大为改进,但还是不尽如人意。

所以我写了个在我所有博客中搜索一个字符串的程序:


      import urllib.request
      dst = "priority_queue"
      f = open('D:\\csdn.txt', 'r', encoding='utf-8')
      for each in f:
         # print(each)
         try:
              html = urllib.request.urlopen(each).read().decode('UTF-8')
             # print(html)
             if dst in html:
                 print(dst+" in "+each)
         except:
             print("error " + each)
  
 

文章来源: blog.csdn.net,作者:csuzhucong,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/nameofcsdn/article/details/125954653

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

作者其他文章

评论(0

抱歉,系统识别当前为高风险访问,暂不支持该操作

    全部回复

    上滑加载中

    设置昵称

    在此一键设置昵称,即可参与社区互动!

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。