python爬网验证码在哪里(详解python 爬取12306验证码)
类别:脚本大全 浏览量:1775
时间:2021-10-03 01:14:13 python爬网验证码在哪里
详解python 爬取12306验证码一个简单的验证码爬取程序
本文介绍了在python2.7环境下爬取网站验证码:
思路就是获取验证码对应的url,然后发起requst请求,读取该url对应的内容,然后写入到一个本地文件,实现一个验证码的保存。大量下载可以把以上程序写入一个死循环
代码实现部分:
|
import ssl import urllib2 i = 1 import time while ( 1 ): #不加的话,无法访问12306 ssl._create_default_https_context = ssl._create_unverified_context # headers = {"user-agent": "mozilla/5.0 (macintosh; intel mac os x 10_11_6) applewebkit/537.36 (khtml, like gecko) chrome/55.0.2883.95 safari/537.36"} # req = urllib2.request("http://211.87.155.19/(yfsvlfreem4d0b553vkfzfzt)/checkcode.aspx", headers=headers) # https: // www.zhihu.com / captcha.jpg" alt="python爬网验证码在哪里(详解python 爬取12306验证码)" border="0" /> req = urllib2.request( "https://kyfw.12306.cn/otn/passcodenew/getpasscodenew?module=login&rand=sjrand&0.7174227166135074" ) u = urllib2.urlopen(req) data = u.read() f = open ( "c:/users/123/desktop/4/" + str (i) + ".jpg" alt="python爬网验证码在哪里(详解python 爬取12306验证码)" border="0" /> print i # time.sleep(1)#有时需要加延时,以防被封。 i = i + 1 f.write(data) f.close() |
以下就是爬取的照片的截图
12306的验证码经常让人眼花缭乱,眼睛仔细看也不能100%的对,算是验证码中比较难是别的。一般由八幅图和一个问题组成,而且图片大小位置固定,问题的位置也是固定的,这也稍微降低了识别的难度。八幅图中一般有两幅图是同一物体,有一个和它比较像。不过有一点暂时没法确定,就是样本库到底有多大,或者说是到底有多少个类别,如果进行训练的话,我们必须获取每个类别个的一定数量的图片作为样本。
以上所述是小编给大家介绍的python爬取12306验证码详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对开心学习网网站的支持!
原文链接:https://blog.csdn.net/daqinjun/article/details/72600235
您可能感兴趣
- python识别验证码教程(Python3.5 + sklearn利用SVM自动识别字母验证码方法示例)
- 宝塔面板服务器连接不上(宝塔面板后台登陆不显示验证码解决办法)
- mysql获取随机数(MySQL 生成随机数字、字符串、日期、验证码及 UUID的方法)
- dedecms无缩略图怎么设置(DEDECMS转移data目录后 验证码不显示解决办法)
- dedecms安全设置(织梦dedecms站点data目录位置变动调整验证码不显示的解决办法)
- antdesignpro引入依赖如何使用(在Ant Design Pro登录功能中集成图形验证码组件的方法步骤)
- 织梦dedecms教程(详解各种dedeCMS织梦后台登陆验证码错误或不显示解决方法大全)
- ci框架怎样修改为https协议(CI框架教程之优化验证码机制详解验证码辅助函数)
- python 验证码识别模块([机器视觉]使用python自动识别验证码详解)
- 怎么用php开发验证码(PHP简单验证码功能机制实例详解)
- 如何用jquery进行表单验证(jQuery实现发送验证码控制按钮禁用功能)
- dedecms迁移data验证码不显示(dedecms织梦上传图片302Error错误的解决方法)
- dedecms验证码要怎么设置(DEDECMS 后台验证码图片不显示的多种解决方法)
- canvas技术开发(用canvas显示验证码的实现)
- dedecms自定义表单验证码(dedecms织梦验证码无法正常显示的3种解决办法)
- dedecms后台内链如何制作(dedecms自定义表单增加验证码的方法分享)
- 靳东领衔打造高精职场 新丽出品《精英律师》曝定妆照(靳东领衔打造高精职场)
- 靳东新剧《精英律师》定档,众星云集,这剧可追(靳东新剧精英律师定档)
- 精英律师 廖佳敏封印恋情曝光,顾婕马失前蹄 你个老不死的(廖佳敏封印恋情曝光)
- 以家人之名广受好评,剧情生动引起观众共鸣,演员张新成圈粉无数(以家人之名广受好评)
- 三兄妹感情再遇波折,人设接连崩塌 《以家人之名》剧情猜不透(三兄妹感情再遇波折)
- 《小敏家》金波想要复婚 这只是他圈套的第1步,更可恶的在后面(小敏家金波想要复婚)
热门推荐
- php中怎么判断变量类型(PHP INT类型在内存中占字节详解)
- 微信小程序映射设置(微信小程序虚拟列表的实现示例)
- filezilla如何连接远程服务器(使用FileZilla快速搭建FTP文件服务的图文教程)
- phplaravel开发规范(Laravel解决nesting level错误和隐藏index.php的问题)
- JSON中的特殊字符
- mysql架构图(深入了解Mysql逻辑架构)
- h5本地存储对比(H5离线存储Manifest原理及使用)
- python常用的属性和方法(Python进阶之@property动态属性的实现)
- javascript如何获取后台数据(JavaScript实现异步获取表单数据)
- docker rabbitmq集群部署(Docker部署rabbitmq遇到的两个问题)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9