python图片识别文字代码(python批量识别图片指定区域文字内容)
类别:脚本大全 浏览量:1659
时间:2021-10-11 00:31:40 python图片识别文字代码
python批量识别图片指定区域文字内容python批量识别图片指定区域文字内容,供大家参考,具体内容如下
简介
对于一张图片,需求识别指定区域的内容
1.截取原始图上的指定图片当做模板
2.根据模板相似度去再原始图片上识别准确坐标
3.根据坐标剪切出指定位置图片,也就是所需的内容区域
4.对指定位置图片进行ocr识别
环境
ubuntu18.04
python2.7
所需python模块
1.aircv
用于识别模板再原始图的位置坐标
|
pip install aircv |
2.pillow
用于剪裁图片
|
pip install pillow |
3.tesseract
文字识别
在此也可以用平台端的api进行更精准的识别
ubuntu下tesseract环境安装
|
sudo apt - get install libpng12 - dev sudo apt - get install libjpeg62 - dev sudo apt - get install libtiff4 - dev sudo apt - get install gcc sudo apt - get install g + + sudo apt - get install automake |
1.tesseract-ocr安装
|
sudo apt - get install tesseract - ocr |
2.pytesseract安装
|
pip install pytesseract |
python代码
识别对应位置
|
#!/usr/bin/python2.7 # -*- coding: utf-8 -*- import aircv def matchimg(imgsrc, imgobj, confidence = 0.2 ): """ 图片对比识别imgobj在imgsrc上的相对位置(批量识别统一图片中需要的部分) :param imgsrc: 原始图片路径(str) :param imgobj: 待查找图片路径(模板)(str) :param confidence: 识别度(0<confidence<1.0) :return: none or dict({'confidence': 相似度(float), 'rectangle': 原始图片上的矩形坐标(tuple), 'result': 中心坐标(tuple)}) """ imsrc = aircv.imread(imgsrc) imobj = aircv.imread(imgobj) match_result = aircv.find_template(imsrc, imobj, confidence) # {'confidence': 0.5435812473297119, 'rectangle': ((394, 384), (394, 416), (450, 384), (450, 416)), 'result': (422.0, 400.0)} if match_result is not none: match_result[ 'shape' ] = (imsrc.shape[ 1 ], imsrc.shape[ 0 ]) # 0为高,1为宽 return match_result |
图片剪裁
|
#!/usr/bin/python2.7 # -*- coding: utf-8 -*- from pil import image, imageenhance def cutimg(imgsrc, out_img_name, coordinate): """ 根据坐标位置剪切图片 :param imgsrc: 原始图片路径(str) :param out_img_name: 剪切输出图片路径(str) :param coordinate: 原始图片上的坐标(tuple) egg:(x, y, w, h) ---> x,y为矩形左上角坐标, w,h为右下角坐标 :return: """ image = image. open (imgsrc) region = image.crop(coordinate) region = imageenhance.contrast(region).enhance( 1.5 ) region.save(out_img_name) |
图片识别
|
#!/usr/bin/python2.7 # -*- coding: utf-8 -*- import pytesseract from pil import image image = image. open ( 'bb.png' ) code = pytesseract.image_to_string(image) print (code) |
对于三方api识别自行研究
以上就是本文的全部内容,希望对大家的学习有所帮助。
原文地址:https://blog.csdn.net/qq_41616397/article/details/87980510
您可能感兴趣
- pythonflask编写接口(Python Flask框架模板操作实例分析)
- python无法拒绝的表白代码教程(很酷的python表白工具 你喜欢我吗)
- python中dict怎么创建(Python数据类型之Dict字典实例详解)
- python 从入门到实践笔记(python基础梳理一推荐)
- python中赋值语句规则(Python动态赋值的陷阱知识点总结)
- python常用列表函数和方法(Python enumerate函数功能与用法示例)
- python中函数最少能定义几个参数(Python函数中不定长参数的写法)
- python改变图片的色深设置(Python实现去除图片中指定颜色的像素功能示例)
- python使用门算法加密文件(python实现可逆简单的加密算法)
- python实现最简单的游戏(20行python代码的入门级小游戏的详解)
- python可以编写数据加密解密吗(python简单实现AES加密和解密)
- python中的变量与变量类型(Python变量类型知识点总结)
- docker镜像内安装python包(如何使用Docker搭建pypi私有仓库)
- pythonrequests爬虫使用教程(Python 通过requests实现腾讯新闻抓取爬虫的方法)
- python标准库操作键盘(Python中捕获键盘的方式详解)
- python中怎么查看函数的用法(Python中函数的基本定义与调用及内置函数详解)
- 省委书记出席的交流会,十位县委书记同场发言,代表公文材料的高水平(省委书记出席的交流会)
- 《刘老根3》热播,去世15年的她却再次被 伤害(去世15年的她却再次被)
- 十二星座爱情支配欲指数(十二星座爱情支配欲指数)
- 虐待儿童是发泄支配欲的愚蠢行为(虐待儿童是发泄支配欲的愚蠢行为)
- 你或许不知道你隐藏的支配欲望(你或许不知道你隐藏的支配欲望)
- 把宽体丰田86卖了,换成7.5代高尔夫GTI玩起姿态与性能并存的改装(把宽体丰田86卖了)
热门推荐
- python分支的描述(学习python分支结构)
- mongodb 分页查询
- dede标签使用(解决{dede:arclist keyword='动态获取关键词'})
- dockerfile映射目录(Dockerfile中ENTRYPOINT 和 CMD的区别说明)
- IIS8.0安装配置完整图文教程 IIS8.0的Web Server asp设置(IIS8.0安装配置完整图文教程 IIS8.0的Web Server asp设置)
- es的写入操作(详解ES9的新特性之异步遍历Async iteration)
- sql如何查询进阶(Superset实现动态SQL查询功能)
- html5新增全局属性(HTML5自定义属性的问题分析)
- mysql substr函数的用法(MySQL切分函数substring的具体使用)
- js怎么上传压缩图片(如何用JS有效的压缩图片)
排行榜
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9