Python中的plisttext和HTTP的Content-Type

举报
程序员历小冰 发表于 2021/08/27 23:58:50 2021/08/27
【摘要】  这段时间本人在学习Android Service相关的内容,临时需要一个可以提供文件上传和下载功能的服务器,于是上网查找了一个简单服务器的python实现代码,本着温顾一下HTTP协议的想法,于是深入研...

 这段时间本人在学习Android Service相关的内容,临时需要一个可以提供文件上传和下载功能的服务器,于是上网查找了一个简单服务器的python实现代码,本着温顾一下HTTP协议的想法,于是深入研究了一下其中的代码,发现大家对SimpleHTTPRequestsHandler中的self.headers.plisttext.split("=")[1]语句的含义不是很理解,于是自己查阅了一下python源码定义和相关HTTP协议文档,理解了这段代码的含义。

源码定义

 我们先来看一下关于plisttext的源码定义。

#https://svn.python.org/projects/python/branches/alpha100/Lib/mimetools.py
class Message(rfc822.Message):
    def __init__(self, fp):
    ....
        self.typeheader = \
            self.getheader('content-type')
        ....
    def parsetype(self):
        str = self.typeheader
        if str == None:
            str = 'text/plain'
        if ';' in str:
            i = string.index(str, ';')
            self.plisttext = str[i:]
            str = str[:i]
        else:
            self.plisttext = ''
        ....
  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18

 从源码中可以得出,plisttext与HTTP头部content-type有关,这里我们就要回想一下content-type的有关定义了。
 在w3c的文档给出了content-type的格式定义,我们可以发现,content-type对的值有可选的内容,使用隔开,所以plisttext的值就是parameter的内容。

Content-Type := type "/" subtype *[";" parameter] 

type :=          "application"     / "audio" 
          / "image"           / "message" 
          / "multipart"  / "text" 
          / "video"           / x-token 

x-token := <The two characters "X-" followed, with no 
           intervening white space, by any token> 

subtype := token 

parameter := attribute "=" value 

attribute := token 

value := token / quoted-string 

token := 1*<any CHAR except SPACE, CTLs, or tspecials> 

tspecials :=  "(" / ")" / "<" / ">" / "@"  ; Must be in 
           /  "," / ";" / ":" / "\" / <">  ; quoted-string, 
           /  "/" / "[" / "]" / "?" / "."  ; to use within 
           /  "="                        ; parameter values 
  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24

使用原理

 知道了plisttext代表的含义,我们再来看一下它在文件上传过程中的作用吧。我们先来看一下它在处理文件上传的post请求时的作用吧。

boundary = self.headers.plisttext.split("=")[1]
remainbytes = int(self.headers['content-length'])
line = self.rfile.readline()
remainbytes -= len(line)
if not boundary in line:
    return (False,"Content NOT begin with boundary")
line = self.rfile.readline()
remainbytes -= len(line)
filename = re.findall(r'Content-Disposition.*name="file"; filename="(.*)"',line)
if not fn:
    return (False,"Can't find out file name")
  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

 我们都知道当通过htmlform来进行文件提交时,浏览器会发送POST请求,并且content-type为multipart/form-data; boundary=----WebKitFormBoundaryqdHXHkzdBEGWWZka,所以,plisttext的值为boundary=----WebKitFormBoundaryqdHXHkzdBEGWWZkaboundaryHTTP的body中会使用到,因为post请求提交了很多类型的数据,所以必须使用boundary进行间隔,也就是所谓的Multipart Content-Type时的body格式。详细的body的格式在w3c的文档中有详细的介绍。

 这里贴一张wireShark截获的tcp包的信息,来帮助大家理解一下这段python代码的原理。通过form提交一份文件和一个名为other的字符串。

 POST / HTTP/1.1
Host: localhost:8080
Connection: keep-alive
Content-Length: 269353
Cache-Control: max-age=0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Origin: http://localhost:8080
User-Agent: Mozilla/5.0 (X11; Linux i686) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/43.0.2357.81 Chrome/43.0.2357.81 Safari/537.36
Content-Type: multipart/form-data; boundary=----WebKitFormBoundaryqdHXHkzdBEGWWZka
Referer: http://localhost:8080/
Accept-Encoding: gzip, deflate
Accept-Language: en-US,en;q=0.8,zh-CN;q=0.6,zh;q=0.4

------WebKitFormBoundaryqdHXHkzdBEGWWZka
Content-Disposition: form-data; name="file"; filename="AndroidStudy.png"
Content-Type: image/png
..... //图片内容
------WebKitFormBoundaryqdHXHkzdBEGWWZka
Content-Disposition: form-data; name="other"

ddd
------WebKitFormBoundaryqdHXHkzdBEGWWZka--
  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22

文章来源: blog.csdn.net,作者:程序员历小冰,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/u012422440/article/details/51525706

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。