课程地址:Python 工程师进阶技术图谱
文章目录
- 类Flask框架请求封装
- HTTP请求解析的python实现
- 1、解析查询字符串
- 2、多值问题
- 使用webob库解析请求
- Bug记录
- bug:AttributeError: module 'cgi' has no attribute 'parse_qs'
类Flask框架请求封装
Web服务器
- 本质是个TCP服务器,监听在特定端口上
- 支持HTTP协议,能够将HTTP请求报文进行解析,能够把响应数据进行HTTP协议的报文封装并返回浏览器端。
APP程序内部也可以请求其它Server,此时就是代理作用。总之,app里面就可以实现各种复杂的功能,只要最后满足WSGI的要求就行。
上一节中实现的app,不论收到什么反馈,都产生一样的响应,这一节将尝试对请求进行解析。
HTTP请求解析的python实现
1、解析查询字符串
查询字符串
- 例
?name=tom&id=1000
,不同的参数之间使用&
分隔开。
代码:
from wsgiref.simple_server import make_serverdef simple_app(environ:dict, start_response):# 读取“请求方法”和“查询字符串”,并提前查询字符串中的信息method = environ.get('REQUEST_METHOD')print(method)query_string = environ.get('QUERY_STRING')print(query_string)# 解析查询字符串d = {}for item in query_string.split('&'):k,_,v = item.partition('=')d[k] = vprint(d)status = '200 OK'headers = [('Content-type', 'text/plain; charset=utf-8')]start_response(status, headers)ret = [query_string.encode('utf-8')]return ret # 报文的正文部分,即网页内容with make_server('0.0.0.0', 9000, simple_app) as httpd:print("Serving on port 9000...")try:httpd.serve_forever()except Exception as e:print(e)except KeyboardInterrupt:print('stop')httpd.server_close()
然后使用我Edge的Postwoman工具发起一个GET请求,url为http://127.0.0.1:9000/?name=tom&id=1000
。
程序在python端就输出解析的查询字符串(第三行),我们将它解析成了一个字典
'''
GET
name=tom&id=1000&age=20
{'name': 'tom', 'id': '1000'}
'''
对于解析查询字符串的一段代码也可以使用下面两种写法,更加简单(行数更少,但感觉可读性不太好):
d = {k:v for k, _, v in map(lambda x:x.partition('='), query_string.split('&'))}
d = {k:v for k, _, v in [item.partition('=') for item in query_string.split('&')]}
或者使用库:
from urllib.parse import parse_qs
qs = parse_qs(query_string)
改用库后,再次发起请求,python端输出解析后的字典:
'''
{'name': ['tom'], 'id': ['1000']}
'''
2、多值问题
此时字典中的value值变成了一个列表,这是因为在url中可以对一个参数传入多值,例如将我们请求的url改成http://127.0.0.1:9000/?name=tom&id=1000&id=666
,python端的输出将变成:
{'name': ['tom'], 'id': ['1000', '666']}
使用webob库解析请求
前面,我们获取请求的信息还需要记下信息的名称
method = environ.get('REQUEST_METHOD')
这显然十分麻烦。而使用webob库,我们可以通过对象的属性来访问请求的信息,只需将environ
参数传给webob库中的Request对象,就可以自动实现解析。代码如下:
from wsgiref.simple_server import make_server
from webob import Requestdef simple_app(environ:dict, start_response):request = Request(environ)query_string = request.query_stringmethon = request.methodprint('methon, query_string: ', methon, query_string)print('request: ', request.GET) # 来自查询字符串的参数print('type(request.GET): ', type(request.GET)) # dictprint('request.POST: ', request.POST) # 来自POST的参数print('request.params: ', request.params) # 所有的参数,包含url的查询字符串,和POST的正文print('request.path: ', request.path)print('request.headers: ', request.headers) # 请求头status = '200 OK'headers = [('Content-type', 'text/plain; charset=utf-8')]start_response(status, headers)ret = [query_string.encode('utf-8')]return ret # 报文的正文部分,即网页内容with make_server('0.0.0.0', 9000, simple_app) as httpd:print("Serving on port 9000...")try:httpd.serve_forever()except Exception as e:print(e)except KeyboardInterrupt:print('stop')httpd.server_close()
我使用Postwoman测试工具发送了一个POST请求,它url的查询字符串中有参数,POST也传输了一个参数age
:
下面是python端的输出
'''
Serving on port 9000...
methon, query_string: POST name=tom&id=1000&id=666
request: GET([('name', 'tom'), ('id', '1000'), ('id', '666')])
type(request.GET): <class 'webob.multidict.GetDict'>
request.POST: MultiDict([('age', '20')])
request.params: NestedMultiDict([('name', 'tom'), ('id', '1000'), ('id', '666'), ('age', '20')])
request.path: /
request.headers: <webob.headers.EnvironHeaders object at 0x000002A24D1D1F00>
'''
Bug记录
bug:AttributeError: module ‘cgi’ has no attribute ‘parse_qs’
错误代码如下
from cgi import parse_qs
qs = parse_qs(query_string)
点进cgi的库查找parse_qs,发现了下面这段代码:
if sys.version_info < (3, 8):def parse_qs(qs: str, keep_blank_values: bool = ..., strict_parsing: bool = ...) -> dict[str, list[str]]: ...def parse_qsl(qs: str, keep_blank_values: bool = ..., strict_parsing: bool = ...) -> list[tuple[str, str]]: ...if sys.version_info >= (3, 7):def parse_multipart(fp: IO[Any], pdict: SupportsGetItem[str, bytes], encoding: str = ..., errors: str = ..., separator: str = ...) -> dict[str, list[Any]]: ...
显然,当sys.version_info>=(3,8)sys.version\_info >= (3, 8)sys.version_info>=(3,8)的时候,函数parse_qs
是不会被定义的。应该是python版本的问题,我换成python3.7版本时,就可以正常运行了。
其实,cgi
库已经过期了,使用urllib
库就好。