十一假期出行火爆,假期结束更优惠
【摘要】 度假型酒店、高品质乡村民宿预订火热。关注各机票酒店平台优惠,爬虫程序实现数据整理采集
刚刚结束的国庆黄金周,全国实现国内旅游收入3890.61亿元,恢复至疫前同期的59.9%。客流主要集中在本地游、周边游、近郊游。以短时间、近距离、高频次为特点的“轻旅游”“微度假”受到游客青睐。一二线城市近郊的度假型酒店、高品质乡村民宿预订火热,房车露营、周边自驾游成为出游热点。相信随着疫情常态化管理的加强,跨省旅游也将逐步恢复,如果有错峰出行的需求,可以及时关注各机票酒店平台,相信会有不小的惊喜。下面的程序可以将几个平台的信息同时整理比较,包括去哪儿、携程、飞猪,可以运行试试:
#! -*- encoding:utf-8 -*-
import requests
import random
import requests.adapters
# 要访问的目标页面
targetUrlList = [
"https://m.ctrip.com/",
"https://m.qunar.com",
"https://m.fliggy.com",
]
# 代理服务器(产品官网 www.16yun.cn)
proxyHost = "t.16yun.cn"
proxyPort = "31111"
# 代理验证信息
proxyUser = "username"
proxyPass = "password"
proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
"host": proxyHost,
"port": proxyPort,
"user": proxyUser,
"pass": proxyPass,
}
# 设置 http和https访问都是用HTTP代理
proxies = {
"http": proxyMeta,
"https": proxyMeta,
}
# 访问三次网站,使用相同的Session(keep-alive),均能够保持相同的外网IP
s = requests.session()
# 设置cookie
# cookie_dict = {"JSESSION":"123456789"}
# cookies = requests.utils.cookiejar_from_dict(cookie_dict, cookiejar=None, overwrite=True)
# s.cookies = cookies
for i in range(3):
for url in targetUrlList:
r = s.get(url, proxies=proxies)
print r.text
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)