- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

全网最全Requests库详解，实例引入，代码分析（ip代理，用户认证，证书检测）

yk 坤帝发表于 2022/03/17 23:54:25 2022/03/17

【摘要】个人公众号：yk 坤帝后台回复 requests库详解获取全部源代码 1.什么是Requests 2.requests 实例引入 3.各种请求方式 4.爬虫GET请求解析，代码步骤分...

个人公众号：yk 坤帝
后台回复 requests库详解获取全部源代码

1.什么是Requests

2.requests 实例引入

3.各种请求方式

4.爬虫GET请求解析，代码步骤分析

4.1 带参数GET请求
4.2 解析json数据
4.3 获取二进制数据
4.4 添加headers

5.爬虫POST请求解析，代码步骤分析

6.爬虫响应状态分析

6.1 reponse属性分析
6.2 返回状态码判断
6.3 异常响应码解析

7. 爬虫高级操作：文件上传，配置应用

8.如何获取cookie？

9.网页会话维持，实现模拟登录

10.合法证书验证

11.ip代理设置

12.超时设置，检测合格ip

13.用户认证设置

14.异常处理

1.什么是Requests

Requests 是⽤Python语⾔编写，基于 urllib，采⽤Apache2 Licensed 开源协议的 HTTP 库。它⽐ urllib 更加⽅便，可以节约我们⼤量的⼯作，完全满⾜HTTP 测试需求。

⼀句话——Python实现的简单易⽤的HTTP库

2.requests 实例引入

import requests

response = requests.get('https://www.baidu.com/')
print(type(response))
print(response.status_code)
print(type(response.text))
print(response.text)
print(response.cookies)

  
 
  1
  2
  3
  4
  5
  6
  7
  8

3.各种请求方式

import requests
requests.post('http://httpbin.org/post')
requests.put('http://httpbin.org/put')
requests.delete('http://httpbin.org/delete')
requests.head('http://httpbin.org/get')
requests.options('http://httpbin.org/get')

  
 
  1
  2
  3
  4
  5
  6

4.爬虫GET请求解析，代码步骤分析

4.1 带参数GET请求

import requests
response = requests.get("http://httpbin.org/get?name=germey&age=22")
print(response.text)

  
 
  1
  2
  3

import requests

data = {
    'name': 'germey',
    'age': 22
}
response = requests.get("http://httpbin.org/get", params=data)
print(response.text)

  
 
  1
  2
  3
  4
  5
  6
  7
  8

4.2 解析json数据

个人公众号：yk 坤帝
后台回复  requests库详解  获取全部源代码

import requests
import json

response = requests.get("http://httpbin.org/get")
print(type(response.text))
print(response.json())
print(json.loads(response.text))
print(type(response.json()))

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11

4.3 获取二进制数据

import requests

response = requests.get("https://github.com/favicon.ico")
print(type(response.text), type(response.content))
print(response.text)
print(response.content)

  
 
  1
  2
  3
  4
  5
  6

import requests

response = requests.get("https://github.com/favicon.ico")
with open('favicon.ico', 'wb') as f:
    f.write(response.content)
    f.close()

  
 
  1
  2
  3
  4
  5
  6

4.4 添加headers

import requests

response = requests.get("https://www.zhihu.com/explore")
print(response.text)

import requests

headers = {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'
}
response = requests.get("https://www.zhihu.com/explore", headers=headers)
print(response.text)

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12

5.爬虫POST请求解析，代码步骤分析

import requests

data = {'name': 'germey', 'age': '22'}
response = requests.post("http://httpbin.org/post", data=data)
print(response.text)

  
 
  1
  2
  3
  4
  5

import requests

data = {'name': 'germey', 'age': '22'}
headers = {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36'
}
response = requests.post("http://httpbin.org/post", data=data, headers=headers)
print(response.json())

  
 
  1
  2
  3
  4
  5
  6
  7
  8

6.爬虫响应状态分析

6.1 reponse属性分析

import requests

response = requests.get('http://www.jianshu.com')
print(type(response.status_code), response.status_code)
print(type(response.headers), response.headers)
print(type(response.cookies), response.cookies)
print(type(response.url), response.url)
print(type(response.history), response.history)

  
 
  1
  2
  3
  4
  5
  6
  7
  8

6.2 返回状态码判断

import requests

response = requests.get('http://www.jianshu.com/hello.html')
exit() if not response.status_code == requests.codes.not_found else print('404 Not Found')

  
 
  1
  2
  3
  4

6.3 异常响应码解析

import requests

response = requests.get('http://www.jianshu.com')
exit() if not response.status_code == 200 else print('Request Successfully')

  
 
  1
  2
  3
  4

100: ('continue',),
101: ('switching_protocols',),
102: ('processing',),
103: ('checkpoint',),
122: ('uri_too_long', 'request_uri_too_long'),
200: ('ok', 'okay', 'all_ok', 'all_okay', 'all_good', '\\o/', '✓'),
201: ('created',),
202: ('accepted',),
203: ('non_authoritative_info', 'non_authoritative_information'),
204: ('no_content',),
205: ('reset_content', 'reset'),
206: ('partial_content', 'partial'),
207: ('multi_status', 'multiple_status', 'multi_stati', 'multiple_stati'),
208: ('already_reported',),
226: ('im_used',),

# Redirection.
300: ('multiple_choices',),
301: ('moved_permanently', 'moved', '\\o-'),
302: ('found',),
303: ('see_other', 'other'),
304: ('not_modified',),
305: ('use_proxy',),
306: ('switch_proxy',),
307: ('temporary_redirect', 'temporary_moved', 'temporary'),
308: ('permanent_redirect',
      'resume_incomplete', 'resume',), # These 2 to be removed in 3.0

# Client Error.
400: ('bad_request', 'bad'),
401: ('unauthorized',),
402: ('payment_required', 'payment'),
403: ('forbidden',),
404: ('not_found', '-o-'),
405: ('method_not_allowed', 'not_allowed'),
406: ('not_acceptable',),
407: ('proxy_authentication_required', 'proxy_auth', 'proxy_authentication'),
408: ('request_timeout', 'timeout'),
409: ('conflict',),
410: ('gone',),
411: ('length_required',),
412: ('precondition_failed', 'precondition'),
413: ('request_entity_too_large',),
414: ('request_uri_too_large',),
415: ('unsupported_media_type', 'unsupported_media', 'media_type'),
416: ('requested_range_not_satisfiable', 'requested_range', 'range_not_satisfiable'),
417: ('expectation_failed',),
418: ('im_a_teapot', 'teapot', 'i_am_a_teapot'),
421: ('misdirected_request',),
422: ('unprocessable_entity', 'unprocessable'),
423: ('locked',),
424: ('failed_dependency', 'dependency'),
425: ('unordered_collection', 'unordered'),
426: ('upgrade_required', 'upgrade'),
428: ('precondition_required', 'precondition'),
429: ('too_many_requests', 'too_many'),
431: ('header_fields_too_large', 'fields_too_large'),
444: ('no_response', 'none'),
449: ('retry_with', 'retry'),
450: ('blocked_by_windows_parental_controls', 'parental_controls'),
451: ('unavailable_for_legal_reasons', 'legal_reasons'),
499: ('client_closed_request',),

# Server Error.
500: ('internal_server_error', 'server_error', '/o\\', '✗'),
501: ('not_implemented',),
502: ('bad_gateway',),
503: ('service_unavailable', 'unavailable'),
504: ('gateway_timeout',),
505: ('http_version_not_supported', 'http_version'),
506: ('variant_also_negotiates',),
507: ('insufficient_storage',),
509: ('bandwidth_limit_exceeded', 'bandwidth'),
510: ('not_extended',),
511: ('network_authentication_required', 'network_auth', 'network_authentication'),

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13
  14
  15
  16
  17
  18
  19
  20
  21
  22
  23
  24
  25
  26
  27
  28
  29
  30
  31
  32
  33
  34
  35
  36
  37
  38
  39
  40
  41
  42
  43
  44
  45
  46
  47
  48
  49
  50
  51
  52
  53
  54
  55
  56
  57
  58
  59
  60
  61
  62
  63
  64
  65
  66
  67
  68
  69
  70
  71
  72
  73
  74
  75

7. 爬虫高级操作：文件上传，配置应用

import requests

files = {'file': open('favicon.ico', 'rb')}
response = requests.post("http://httpbin.org/post", files=files)
print(response.text)

  
 
  1
  2
  3
  4
  5

8.如何获取cookie？

import requests

response = requests.get("https://www.baidu.com")
print(response.cookies)
for key, value in response.cookies.items():
    print(key + '=' + value)

  
 
  1
  2
  3
  4
  5
  6

9.网页会话维持，实现模拟登录

import requests

requests.get('http://httpbin.org/cookies/set/number/123456789')
response = requests.get('http://httpbin.org/cookies')
print(response.text)

  
 
  1
  2
  3
  4
  5

import requests

s = requests.Session()
s.get('http://httpbin.org/cookies/set/number/123456789')
response = s.get('http://httpbin.org/cookies')
print(response.text)

  
 
  1
  2
  3
  4
  5
  6

10.合法证书验证

import requests

response = requests.get('https://www.12306.cn')
print(response.status_code)

  
 
  1
  2
  3
  4

import requests
from requests.packages import urllib3
urllib3.disable_warnings()
response = requests.get('https://www.12306.cn', verify=False)
print(response.status_code)

  
 
  1
  2
  3
  4
  5

import requests

response = requests.get('https://www.12306.cn', cert=('/path/server.crt', '/path/key'))
print(response.status_code)

  
 
  1
  2
  3
  4

11.ip代理设置

个人公众号：yk 坤帝
后台回复  requests库详解  获取全部源代码

import requests

proxies = {
  "http": "http://127.0.0.1:9743",
  "https": "https://127.0.0.1:9743",
}

response = requests.get("https://www.taobao.com", proxies=proxies)
print(response.status_code)

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12

import requests

proxies = {
    "http": "http://user:password@127.0.0.1:9743/",
}
response = requests.get("https://www.taobao.com", proxies=proxies)
print(response.status_code)

  
 
  1
  2
  3
  4
  5
  6
  7

pip3 install 'requests[socks]'

  
 
  1

import requests

proxies = {
    'http': 'socks5://127.0.0.1:9742',
    'https': 'socks5://127.0.0.1:9742'
}
response = requests.get("https://www.taobao.com", proxies=proxies)
print(response.status_code)

  
 
  1
  2
  3
  4
  5
  6
  7
  8

12.超时设置，检测合格ip

import requests
from requests.exceptions import ReadTimeout
try:
    response = requests.get("http://httpbin.org/get", timeout = 0.5)
    print(response.status_code)
except ReadTimeout:
    print('Timeout')

  
 
  1
  2
  3
  4
  5
  6
  7

13.用户认证设置

import requests
from requests.auth import HTTPBasicAuth

r = requests.get('http://120.27.34.24:9001', auth=HTTPBasicAuth('user', '123'))
print(r.status_code)

  
 
  1
  2
  3
  4
  5

import requests

r = requests.get('http://120.27.34.24:9001', auth=('user', '123'))
print(r.status_code)

  
 
  1
  2
  3
  4

14.异常处理

import requests
from requests.exceptions import ReadTimeout, ConnectionError, RequestException
try:
    response = requests.get("http://httpbin.org/get", timeout = 0.5)
    print(response.status_code)
except ReadTimeout:
    print('Timeout')
except ConnectionError:
    print('Connection error')
except RequestException:
    print('Error')

  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11

个人公众号：yk 坤帝
后台回复  requests库详解  获取全部源代码

  
 
  1
  2

文章来源: blog.csdn.net，作者：yk 坤帝，版权归原作者所有，如需转载，请联系作者。

原文链接：blog.csdn.net/qq_45803923/article/details/123555651

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

全网最全Requests库详解，实例引入，代码分析（ip代理，用户认证，证书检测）

1.什么是Requests

2.requests 实例引入

3.各种请求方式

4.爬虫GET请求解析，代码步骤分析

5.爬虫POST请求解析，代码步骤分析

6.爬虫响应状态分析

7. 爬虫高级操作：文件上传，配置应用

8.如何获取cookie？

9.网页会话维持，实现模拟登录

10.合法证书验证

11.ip代理设置

12.超时设置，检测合格ip

13.用户认证设置

14.异常处理

12.超时设置，检测合格ip

13.用户认证设置

14.异常处理

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

全网最全Requests库详解，实例引入，代码分析（ip代理，用户认证，证书检测）

1.什么是Requests

2.requests 实例引入

3.各种请求方式

4.爬虫GET请求解析，代码步骤分析

5.爬虫POST请求解析，代码步骤分析

6.爬虫响应状态分析

7. 爬虫高级操作：文件上传，配置应用

8.如何获取cookie？

9.网页会话维持，实现模拟登录

10.合法证书验证

11.ip代理设置

12.超时设置，检测合格ip

13.用户认证设置

14.异常处理

12.超时设置，检测合格ip

13.用户认证设置

14.异常处理

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品