python图片识别文字代码(python批量识别图片指定区域文字内容)
类别:脚本大全 浏览量:1659
时间:2021-10-11 00:31:40 python图片识别文字代码
python批量识别图片指定区域文字内容python批量识别图片指定区域文字内容,供大家参考,具体内容如下
简介
对于一张图片,需求识别指定区域的内容
1.截取原始图上的指定图片当做模板
2.根据模板相似度去再原始图片上识别准确坐标
3.根据坐标剪切出指定位置图片,也就是所需的内容区域
4.对指定位置图片进行ocr识别
环境
ubuntu18.04
python2.7
所需python模块
1.aircv
用于识别模板再原始图的位置坐标
|
pip install aircv |
2.pillow
用于剪裁图片
|
pip install pillow |
3.tesseract
文字识别
在此也可以用平台端的api进行更精准的识别
ubuntu下tesseract环境安装
|
sudo apt - get install libpng12 - dev sudo apt - get install libjpeg62 - dev sudo apt - get install libtiff4 - dev sudo apt - get install gcc sudo apt - get install g + + sudo apt - get install automake |
1.tesseract-ocr安装
|
sudo apt - get install tesseract - ocr |
2.pytesseract安装
|
pip install pytesseract |
python代码
识别对应位置
|
#!/usr/bin/python2.7 # -*- coding: utf-8 -*- import aircv def matchimg(imgsrc, imgobj, confidence = 0.2 ): """ 图片对比识别imgobj在imgsrc上的相对位置(批量识别统一图片中需要的部分) :param imgsrc: 原始图片路径(str) :param imgobj: 待查找图片路径(模板)(str) :param confidence: 识别度(0<confidence<1.0) :return: none or dict({'confidence': 相似度(float), 'rectangle': 原始图片上的矩形坐标(tuple), 'result': 中心坐标(tuple)}) """ imsrc = aircv.imread(imgsrc) imobj = aircv.imread(imgobj) match_result = aircv.find_template(imsrc, imobj, confidence) # {'confidence': 0.5435812473297119, 'rectangle': ((394, 384), (394, 416), (450, 384), (450, 416)), 'result': (422.0, 400.0)} if match_result is not none: match_result[ 'shape' ] = (imsrc.shape[ 1 ], imsrc.shape[ 0 ]) # 0为高,1为宽 return match_result |
图片剪裁
|
#!/usr/bin/python2.7 # -*- coding: utf-8 -*- from pil import image, imageenhance def cutimg(imgsrc, out_img_name, coordinate): """ 根据坐标位置剪切图片 :param imgsrc: 原始图片路径(str) :param out_img_name: 剪切输出图片路径(str) :param coordinate: 原始图片上的坐标(tuple) egg:(x, y, w, h) ---> x,y为矩形左上角坐标, w,h为右下角坐标 :return: """ image = image. open (imgsrc) region = image.crop(coordinate) region = imageenhance.contrast(region).enhance( 1.5 ) region.save(out_img_name) |
图片识别
|
#!/usr/bin/python2.7 # -*- coding: utf-8 -*- import pytesseract from pil import image image = image. open ( 'bb.png' ) code = pytesseract.image_to_string(image) print (code) |
对于三方api识别自行研究
以上就是本文的全部内容,希望对大家的学习有所帮助。
原文地址:https://blog.csdn.net/qq_41616397/article/details/87980510
您可能感兴趣
- python 链表操作(Python3实现的判断环形链表算法示例)
- python图文生成器(Python生成器的使用方法和示例代码)
- python将字符串转换为时间格式(Python时间和字符串转换操作实例分析)
- python矩阵怎么生成(python实现矩阵打印)
- python numpy 安装(python3.6下Numpy库下载与安装图文教程)
- python如何对参数长度进行限制(python 多个参数不为空校验方法)
- python时间类的实现(Python日期时间Time模块实例详解)
- python线程安全队列(Python 限制线程的最大数量的方法Semaphore)
- python云服务技术(Python脚本修改阿里云的访问控制列表的方法)
- python中迭代器的作用(Python3.5迭代器与生成器用法实例分析)
- 聊天室python小程序(用Python写一个模拟qq聊天小程序的代码实例)
- python面向对象使用方法(Python面向对象程序设计之私有属性及私有方法示例)
- python进行回归分析(Python多项式回归的实现方法)
- python多线程和多进程应用场景(Python多线程处理实例详解单进程/多进程)
- pythonftp功能介绍(使用Python操作FTP实现上传和下载的方法)
- python中比较同一字典value(在Python 字典中一键对应多个值的实例)
- 元宵晚会槽点多,芒果台上来就假唱,岳云鹏不说相声改评书了(元宵晚会槽点多)
- 岳云鹏跟凤凰传奇谈心,说出了人生中最重要的三个人,这才成功(岳云鹏跟凤凰传奇谈心)
- 爱情可以当饭吃吗(爱情能当饭吃吗)
- Top 3 JSHS《运动与健康科学 英文 》跻身SCI体育学期刊世界前三(Top3JSHS运动与健康科学)
- 体坛传媒LOGO全新升级,多元发展迈出坚实步伐(体坛传媒LOGO全新升级)
- 超撩人治愈的绝美水彩,原来出自她之手 一笔一画令无数人沉醉(超撩人治愈的绝美水彩)
热门推荐
- python中列表remove的用法汇总(对python_discover方法遍历所有执行的用例详解)
- cubeide调试问题(如何使用宝塔安装ionCube扩展)
- xampp安装后启动apache弹出对话框(XAMPP下使用顶级域名绑定虚拟主机的配置方法和示例)
- laravel服务器设置(基于Laravel-admin 后台的自定义页面用法详解)
- 护卫神主机大师使用教程(护卫神主机大师软件窗口显示不全的解决办法)
- python selenium用法详解(python selenium执行所有测试用例并生成报告的方法)
- vue pdf预览插件(Vue-pdf实现在线预览PDF文件)
- css赛博朋克风格效果(CSS几步实现赛博朋克2077风格视觉效果)
- cpu怎么访问php(服务器大量php-cgi.exe进程导致CPU占用100%的解决方法)
- js防抖用法(JavaScript的防抖和节流案例)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9