Python Request库的cookie使用

Python Request库的cookie使用

认识Cookie

Cookie总是保存在客户端中,按在客户端中的存储位置,可分为内存Cookie和硬盘Cookie。内存Cookie由浏览器维护,保存在内存中,浏览器关闭后就消失了,其存在时间是短暂的。硬盘Cookie保存在硬盘里,有一个过期时间,除非用户手工清理或到了过期时间,硬盘Cookie不会被删除,其存在时间是长期的。所以,按存在时间,可分为非持久Cookie和持久Cookie。

cookie的属性

一般cookie所具有的属性,包括:

Domain:域,表示当前cookie所属于哪个域或子域下面。

对于服务器返回的Set-Cookie中,如果没有指定Domain的值,那么其Domain的值是默认为当前所提交的http的请求所对应的主域名的。比如访问 http://www.example.com,返回一个cookie,没有指名domain值,那么其为值为默认的www.example.com

Path:表示cookie的所属路径。

Expire time/Max-age:表示了cookie的有效期。expire的值,是一个时间,过了这个时间,该cookie就失效了。或者是用max-age指定当前cookie是在多长时间之后而失效。如果服务器返回的一个cookie,没有指定其expire time,那么表明此cookie有效期只是当前的session,即是session cookie,当前session会话结束后,就过期了。对应的,当关闭(浏览器中)该页面的时候,此cookie就应该被浏览器所删除了。

secure:表示该cookie只能用https传输。一般用于包含认证信息的cookie,要求传输此cookie的时候,必须用https传输。

httponly:表示此cookie必须用于httphttps传输。这意味着,浏览器脚本,比如javascript中,是不允许访问操作此cookie的。

服务器发送cookie给客户端

从服务器端,发送cookie给客户端,是对应的Set-Cookie。包括了对应的cookie的名称,值,以及各个属性。

1
2
3
4
5
Set-Cookie: lu=Rg3vHJZnehYLjVg7qi3bZjzg; Expires=Tue, 15 Jan 2013 21:47:38 GMT; Path=/; Domain=.169it.com; HttpOnly

Set-Cookie: made_write_conn=1295214458; Path=/; Domain=.169it.com

Set-Cookie: reg_fb_gate=deleted; Expires=Thu, 01 Jan 1970 00:00:01 GMT; Path=/; Domain=.169it.com; HttpOnly
从客户端把cookie发送到服务器

从客户端发送cookie给服务器的时候,是不发送cookie的各个属性的,而只是发送对应的名称和值。

1
2
3
4
5
6
7
GET /spec.html HTTP/1.1  

Host: www.example.org

Cookie: name=value; name2=value2

Accept: */*
关于修改,设置cookie

除了服务器发送给客户端(浏览器)的时候,通过Set-Cookie,创建或更新对应的cookie之外,还可以通过浏览器内置的一些脚本,比如javascript,去设置对应的cookie,对应实现是操作js中的document.cookie

requests.get/post中cookie的使用

方法一:利用cookie参数发送

首先明确requests.get返回的cookie的两种形式:

1
res = requests.get()
  • 1
    cookie1 = res.headers['Set-Cookie']

    此种形式返回的cookie为字符串:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    '__jsluid_h=1b8d0668bb7c319259dfcdfbca64a8be; max-age=31536000; path=/; HttpOnly'

    # 针对此种形式的cookie,可以利用如下方法转化为字典类型
    # 把cookie从字符串=转换为dict
    def process_cookie(str_cookie):
    attrs = str_cookie.split(";")
    new_cookie = {}
    for attr in attrs:
    key, value = attr.split("=")
    if key.lower() in ["domain", "path", "expire time", "max-age", "secure", "httponly"]:
    continue
    new_cookie[key] = value
    return new_cookie
  • 1
    cookie2 = res.cookies

    此种形式返回的cookie是RequestsCookieJar,它的行为和字典类似

    如直接取相关key的值(前提是知道有哪些key)

    1
    2
    print(cookie2['__jsluid_h'])
    1b8d0668bb7c319259dfcdfbca64a8be

    还可以利用requests.utils.dict_from_cookiejar把cookie转换为真实dict类型:

    1
    2
    3
    cookie2 = requests.utils.dict_from_cookiejar(cookie2)
    print(cookie2)
    {'__jsluid_h': '1b8d0668bb7c319259dfcdfbca64a8be'}

接下来看如何把cookie已cookie参数的形式发送给服务端:

上面在认识cookie中介绍了发送cookie给服务端只需要cookie的key和value即可,不需要发送属性,然后requests.get方法的cookies参数的形式为dict形式:

1
2
cookie = {'__jsluid_h': '1b8d0668bb7c319259dfcdfbca64a8be'}
res = requests.get(cookies=cookie)
方法二:利用header参数发送

除了利用cookie参数向服务端发送cookie,还可以把cookie放在header中发送:

1
2
3
4
5
cookie = "__jsluid_h=1b8d0668bb7c319259dfcdfbca64a8be"
headers = {
"cookie": cookie
}
res = requests.get(headers=headers)

session中cookie的使用

未完待续……