网站一反爬破解
这个网站的反爬比较初级,页面上有一个滑动验证码,但是不存在js
加密反爬之类的东西,所以只需要识别出来验证码图片的缺口位置,以Post参数的形式返回给服务端就可以请求到数据了。
本次流程有两种方式来实现,一种方式是使用requests.get()/post()
的形式,另一种方式是使用session;前一种方式需要先请求获取cookie,然后每次携带cookie进行请求,后一种方式相对步骤简单些。
这里选择使用session的方式。
如果用前一种方式尝试,直接请求该网站主页返回的信息中没有cookie,直接请求获取验证码的url
时既可以获取图片信息,也可以获取cookie。
第一步:请求验证码图片
请求到验证码图片后,可以根据缺口位置的
RGB
颜色值范围,来找出缺口的位置,也可以先灰度化处理,再来判断缺口的位置,这里先灰度化。