python爬网验证码在哪里(详解python 爬取12306验证码)
类别:脚本大全 浏览量:1775
时间:2021-10-03 01:14:13 python爬网验证码在哪里
详解python 爬取12306验证码一个简单的验证码爬取程序
本文介绍了在python2.7环境下爬取网站验证码:
思路就是获取验证码对应的url,然后发起requst请求,读取该url对应的内容,然后写入到一个本地文件,实现一个验证码的保存。大量下载可以把以上程序写入一个死循环
代码实现部分:
|
import ssl import urllib2 i = 1 import time while ( 1 ): #不加的话,无法访问12306 ssl._create_default_https_context = ssl._create_unverified_context # headers = {"user-agent": "mozilla/5.0 (macintosh; intel mac os x 10_11_6) applewebkit/537.36 (khtml, like gecko) chrome/55.0.2883.95 safari/537.36"} # req = urllib2.request("http://211.87.155.19/(yfsvlfreem4d0b553vkfzfzt)/checkcode.aspx", headers=headers) # https: // www.zhihu.com / captcha.jpg" alt="python爬网验证码在哪里(详解python 爬取12306验证码)" border="0" /> req = urllib2.request( "https://kyfw.12306.cn/otn/passcodenew/getpasscodenew?module=login&rand=sjrand&0.7174227166135074" ) u = urllib2.urlopen(req) data = u.read() f = open ( "c:/users/123/desktop/4/" + str (i) + ".jpg" alt="python爬网验证码在哪里(详解python 爬取12306验证码)" border="0" /> print i # time.sleep(1)#有时需要加延时,以防被封。 i = i + 1 f.write(data) f.close() |
以下就是爬取的照片的截图
12306的验证码经常让人眼花缭乱,眼睛仔细看也不能100%的对,算是验证码中比较难是别的。一般由八幅图和一个问题组成,而且图片大小位置固定,问题的位置也是固定的,这也稍微降低了识别的难度。八幅图中一般有两幅图是同一物体,有一个和它比较像。不过有一点暂时没法确定,就是样本库到底有多大,或者说是到底有多少个类别,如果进行训练的话,我们必须获取每个类别个的一定数量的图片作为样本。
以上所述是小编给大家介绍的python爬取12306验证码详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对开心学习网网站的支持!
原文链接:https://blog.csdn.net/daqinjun/article/details/72600235
您可能感兴趣
- python 爬虫图形验证码(Python爬虫实现验证码登录代码实例)
- dedecms无缩略图怎么设置(DEDECMS转移data目录后 验证码不显示解决办法)
- 怎么用php开发验证码(PHP简单验证码功能机制实例详解)
- mysql获取随机数(MySQL 生成随机数字、字符串、日期、验证码及 UUID的方法)
- python 验证码识别模块([机器视觉]使用python自动识别验证码详解)
- dedecms迁移data验证码不显示(dedecms织梦上传图片302Error错误的解决方法)
- php验证码初始化教程交流(PHP token验证生成原理实例分析)
- laravel多用户认证实例(Laravel框架验证码类用法实例分析)
- python验证码处理教程(python简单验证码识别的实现方法)
- django session验证(Django框架验证码用法实例分析)
- python自动识别旋转验证码(Python实现字符型图片验证码识别完整过程详解)
- dedecms自定义表单验证码(dedecms织梦验证码无法正常显示的3种解决办法)
- python复杂的验证码处理(Python 通过打码平台实现验证码的实现)
- 如何用jquery进行表单验证(jQuery实现发送验证码控制按钮禁用功能)
- devc报错信息找不到(dede5.7验证码错误不显示的解决方法)
- dedecms怎么上线(dedecms关闭后台/会员/留言/板验证码的方法)
- 吐槽完《弧光大作战》之后,我们和设计师聊了聊魔兽首款手游的立项初衷和未来(吐槽完弧光大作战之后)
- 魔兽争霸3自定义战役少年杰雷 2(魔兽争霸3自定义战役少年杰雷)
- 今日菜价 芥兰涨幅最高 1.33 ,花菜降幅最高 3.10(今日菜价芥兰涨幅最高)
- 今日菜价 椰菜涨幅最高 3.25 ,水空心菜降幅最高 2.58(今日菜价椰菜涨幅最高)
- 今日菜价 红三鱼涨幅最高 4.41 ,黄鳝降幅最高 5.06(红三鱼涨幅最高)
- 今日菜价 西生菜涨幅最高 6.19 ,生菜降幅最高 5.38(西生菜涨幅最高)
热门推荐
- dockerfile构建镜像两种方式(通过Dockerfile构建Docker镜像的方法步骤)
- sqlserver数据库实时同步(SQL Server实时同步更新远程数据库遇到的问题小结)
- Docker 运行多个Springboot的详细教程(Docker 运行多个Springboot的详细教程)
- js截取字符串
- 常见伪静态规则(通过伪静态解决中文乱码问题)
- 新加坡服务器目前负载(新加坡服务器好不好?新加坡服务器有什么优势?)
- SQLServer数据库从高版本降级到低版本实例详解(SQLServer数据库从高版本降级到低版本实例详解)
- 用php递归函数实现阶乘的计算(php求斐波那契数的两种实现方式递归与递推)
- jQuery给动态添加的元素绑定事件
- linux查看负载命令(在Linux命令行中使用计算器的5个命令详解)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9