中文点选验证码——语序
前面一直在研究文字点选验证码的文字识别,在文字识别之后,对于有语序要求的,还需要我们自己去按照正确的语序顺序去点击才能通过,例如:
外圆内方
积少成多
得道者多助
利用结巴分词技术可以解决此问题,但是仅限于词语效果较好,对于古诗或者谚语等效果比较差;其中还借助了结巴分词得dict.txt
,其中保存了常见词得词频和词性,在使用得时候可以根据自己的需求进行调整。
1 | import jieba |
测试结果:
方外内圆 –> 外圆内方
成少积多 –> 积少成多
者多道得助 –> 未识别出结果
铁磨成杵针 –> 铁杵磨成针