ocr文字识别包离线(基于chineseocrlite的身份证火车票)

简介

chineseOCR_lite 超轻量级中文ocr,支持竖排文字识别, 支持ncnn推理 , psenet(8.5M) crnn(6.3M) anglenet(1.5M) 总模型仅17M

Docker安装chineseocr_lite

docker run -dit -p 8080:8080 -v /mnt/d/data/:/data --name chineseocr vitzy/chineseocr_lite # 查询镜像 docker ps # 进入容器 docker exec -it <your container name or id> /bin/bash # 拉取代码 cd data/ git clone https://github.com/ouyanghuiyu/chineseocr_lite # 运行项目 cd chineseocr_lite/ python3 app.py 8080

在浏览器中打开 http://127.0.0.1:8080/ocr

通用OCR测试

ocr文字识别包离线(基于chineseocrlite的身份证火车票)(1)

基本文字都识别出来,打分:90分

火车票测试

ocr文字识别包离线(基于chineseocrlite的身份证火车票)(2)

关键内容识别不出来,打分:30分

身份证测试

ocr文字识别包离线(基于chineseocrlite的身份证火车票)(3)

身份证号、地址可以识别出来,姓名、出生日期没有。打分:60分

银行卡测试

ocr文字识别包离线(基于chineseocrlite的身份证火车票)(4)

银行卡识别错误,中文文字基本都对,打分:20分

车牌号识别

ocr文字识别包离线(基于chineseocrlite的身份证火车票)(5)

车牌号完全正确,打分:100分

总结

chineseocr_lite 对于中文文字识正确别率大约在80%以上,但是对于特定的模型利于火车票识别率较低,需要自己训练模型。市场上的大部分OCR都是要收费的,开源中文OCR项目更是少之又少,感谢作者的开源。源码地址:https://github.com/ouyanghuiyu/chineseocr_lite ,有兴趣的同学可以去下载学习。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页