Python Request库的cookie使用
认识Cookie
Cookie总是保存在客户端中,按在客户端中的存储位置,可分为内存Cookie和硬盘Cookie。内存Cookie由浏览器维护,保存在内存中,浏览器关闭后就消失了,其存在时间是短暂的。硬盘Cookie保存在硬盘里,有一个过期时间,除非用户手工清理或到了过期时间,硬盘Cookie不会被删除,其存在时间是长期的。所以,按存在时间,可分为非持久Cookie和持久Cookie。
cookie的属性
一般cookie所具有的属性,包括:
Domain:域,表示当前cookie所属于哪个域或子域下面。
对于服务器返回的Set-Cookie中,如果没有指定Domain的值,那么其Domain的值是默认为当前所提交的http
的请求所对应的主域名的。比如访问 http://www.example.com,返回一个cookie,没有指名domain值,那么其为值为默认的www.example.com
。
Path:表示cookie的所属路径。
Expire time/Max-age:表示了cookie的有效期。expire的值,是一个时间,过了这个时间,该cookie就失效了。或者是用max-age指定当前cookie是在多长时间之后而失效。如果服务器返回的一个cookie,没有指定其expire time,那么表明此cookie有效期只是当前的session,即是session cookie,当前session会话结束后,就过期了。对应的,当关闭(浏览器中)该页面的时候,此cookie就应该被浏览器所删除了。
secure:表示该cookie只能用https
传输。一般用于包含认证信息的cookie,要求传输此cookie的时候,必须用https
传输。
httponly
:表示此cookie必须用于http
或https
传输。这意味着,浏览器脚本,比如javascript
中,是不允许访问操作此cookie的。
服务器发送cookie给客户端
从服务器端,发送cookie给客户端,是对应的Set-Cookie。包括了对应的cookie的名称,值,以及各个属性。
1 | Set-Cookie: lu=Rg3vHJZnehYLjVg7qi3bZjzg; Expires=Tue, 15 Jan 2013 21:47:38 GMT; Path=/; Domain=.169it.com; HttpOnly |
从客户端把cookie发送到服务器
从客户端发送cookie给服务器的时候,是不发送cookie的各个属性的,而只是发送对应的名称和值。
1 | GET /spec.html HTTP/1.1 |
关于修改,设置cookie
除了服务器发送给客户端(浏览器)的时候,通过Set-Cookie,创建或更新对应的cookie之外,还可以通过浏览器内置的一些脚本,比如javascript
,去设置对应的cookie,对应实现是操作js
中的document.cookie
。
requests.get/post
中cookie的使用
方法一:利用cookie参数发送
首先明确requests.get
返回的cookie的两种形式:
1 | res = requests.get() |
1
cookie1 = res.headers['Set-Cookie']
此种形式返回的cookie为字符串:
1
2
3
4
5
6
7
8
9
10
11
12
13'__jsluid_h=1b8d0668bb7c319259dfcdfbca64a8be; max-age=31536000; path=/; HttpOnly'
# 针对此种形式的cookie,可以利用如下方法转化为字典类型
# 把cookie从字符串=转换为dict
def process_cookie(str_cookie):
attrs = str_cookie.split(";")
new_cookie = {}
for attr in attrs:
key, value = attr.split("=")
if key.lower() in ["domain", "path", "expire time", "max-age", "secure", "httponly"]:
continue
new_cookie[key] = value
return new_cookie1
cookie2 = res.cookies
此种形式返回的cookie是
RequestsCookieJar
,它的行为和字典类似如直接取相关key的值(前提是知道有哪些key)
1
2print(cookie2['__jsluid_h'])
1b8d0668bb7c319259dfcdfbca64a8be还可以利用
requests.utils.dict_from_cookiejar
把cookie转换为真实dict
类型:1
2
3cookie2 = requests.utils.dict_from_cookiejar(cookie2)
print(cookie2)
{'__jsluid_h': '1b8d0668bb7c319259dfcdfbca64a8be'}
接下来看如何把cookie已cookie参数的形式发送给服务端:
上面在认识cookie中介绍了发送cookie给服务端只需要cookie的key和value即可,不需要发送属性,然后requests.get
方法的cookies参数的形式为dict
形式:
1 | cookie = {'__jsluid_h': '1b8d0668bb7c319259dfcdfbca64a8be'} |
方法二:利用header参数发送
除了利用cookie参数向服务端发送cookie,还可以把cookie放在header中发送:
1 | cookie = "__jsluid_h=1b8d0668bb7c319259dfcdfbca64a8be" |
session中cookie的使用
未完待续……