使用selenium下载煎蛋网加密妹子图

举报
悦来客栈的老板 发表于 2020/12/28 23:56:15 2020/12/28
【摘要】 #!/usr/bin/env python# -*- coding: utf-8 -*-#coding=utf-8 import requests import urllib.requestfrom bs4 import BeautifulSoupfrom selenium import webdriver urls = ('http://jandan.net/ooxx/p...

  
  1. #!/usr/bin/env python
  2. # -*- coding: utf-8 -*-
  3. #coding=utf-8
  4. import requests
  5. import urllib.request
  6. from bs4 import BeautifulSoup
  7. from selenium import webdriver
  8. urls = ('http://jandan.net/ooxx/page-{}#comments'.format(i) for i in range(300,327))
  9. x = 1
  10. user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:57.0) Gecko/20100101 Firefox/57.0'
  11. driver=webdriver.Firefox()
  12. driver.maximize_window()
  13. for url in urls:
  14. print ("正在访问{}".format(url))
  15. try:
  16. driver.get(url)
  17. driver.implicitly_wait(10)
  18. data = driver.page_source
  19. soup = BeautifulSoup(data, 'lxml')
  20. hrefs = soup.find_all('a',class_="view_img_link")
  21. except:
  22. print ("访问异常!")
  23. continue
  24. print ("开始下载")
  25. for href in hrefs:
  26. img = href.get('href')
  27. img = "http:" + img
  28. if img[-3:] != 'jpg':
  29. continue
  30. print ("正在下载第{}张图片".format(x))
  31. urllib.request.urlretrieve(img,'%s.jpg' % (x))
  32. x = x+1

文章来源: blog.csdn.net,作者:悦来客栈的老板,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/qq523176585/article/details/78638017

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。