Ptyhon爬虫实战(七):爬取汽车公告网上的批次排量等信息
【摘要】 网址:http://www.cn357.com/notice/
直接上代码。
#coding=utf-8import reimport requests def getHtml(url): try: page = requests.get(url) html = page.text return html except: print ("网页访问异常") ...
网址:http://www.cn357.com/notice/
直接上代码。
-
#coding=utf-8
-
import re
-
import requests
-
-
def getHtml(url):
-
try:
-
page = requests.get(url)
-
html = page.text
-
return html
-
except:
-
print ("网页访问异常")
-
return ""
-
-
def getInfo(html):
-
reg = re.compile(r".*?公告批次:(.*?),生产企业:.*?识别代号:(.*?),轴数:.*?发动机排量:(.*?),发动机功率:",re.S)
-
items = re.findall(reg,html)
-
for item in items:
-
print("\t".join(list(map(str.strip,item))))
-
-
-
if __name__=='__main__':
-
for i in range(1,61):
-
url = "http://www.cn357.com/cvi.php?m=cvinotice&search=n&brand=%B1%F0%BF%CB&page=" + str(i)
-
html = getHtml(url)
-
getInfo(html)
文章来源: blog.csdn.net,作者:悦来客栈的老板,版权归原作者所有,如需转载,请联系作者。
原文链接:blog.csdn.net/qq523176585/article/details/77893373
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)