Ptyhon爬虫实战(七):爬取汽车公告网上的批次排量等信息
【摘要】 网址:http://www.cn357.com/notice/
直接上代码。
#coding=utf-8import reimport requests def getHtml(url): try: page = requests.get(url) html = page.text return html except: print ("网页访问异常") ...
网址:http://www.cn357.com/notice/
直接上代码。
#coding=utf-8
import re
import requests
def getHtml(url):
try:
page = requests.get(url)
html = page.text
return html
except:
print ("网页访问异常")
return ""
def getInfo(html):
reg = re.compile(r".*?公告批次:(.*?),生产企业:.*?识别代号:(.*?),轴数:.*?发动机排量:(.*?),发动机功率:",re.S)
items = re.findall(reg,html)
for item in items:
print("\t".join(list(map(str.strip,item))))
if __name__=='__main__':
for i in range(1,61):
url = "http://www.cn357.com/cvi.php?m=cvinotice&search=n&brand=%B1%F0%BF%CB&page=" + str(i)
html = getHtml(url)
getInfo(html)
文章来源: blog.csdn.net,作者:悦来客栈的老板,版权归原作者所有,如需转载,请联系作者。
原文链接:blog.csdn.net/qq523176585/article/details/77893373
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
作者其他文章
评论(0)