ocr文字识别后的文档如何编辑(转成可编辑的文本)

TextGrabber Translator 是 ABBYY 出品的一款图像 OCR 翻译应用,这家俄罗斯开发商还上架有许多扫描类、PDF 阅读器等应用,虽然你可能没听说过它,但它其实是一个低调的技术支持公司,它的 OCR 技术广为许多大厂所用,包括富士通、东芝、三星、微软等等,它都是背后默默无闻的那个男人。

虽然市面上主打扫描 识别的应用很多,如 Scanbot、扫描全能王等,TextGrabber 的主打优势在于识别的语言多达 60 多种,甚至整个 OCR 过程都是在本地完成的,全程都不需要联网,这也大大提高了识别的速度。

有了它,这些事情都更简单了

在详细介绍 TextGrabber 的操作使用之前,我们先来谈一谈哪些地方你可能会用到它。

对于学生党来说,是不是积累了大量内容,平时都是用手写记录的?想转成电子版永久保存?咳,光有 TextGrabber 显然是不够的,你还得字写得好看、工整,才能识别得出来啦。不过,如果你手上有许多打印的讲义、资料,倒是可以很方便地用它直接扫描下来,然后转成文字,加上 TextGrabber 原生支持 Evernote,你可以很方便地将这一切保存下来。

而对于工作党呢,用处就更多啦。想想桌面上杂乱无章的那些合同、扫描件,还有些不靠谱的客户,明明可以发文字的东西,就是截张图丢给你就不管了。这种叫天天不应,叫地地不灵的时候,当然还是用 TextGrabber 来解围啦。

就算在生活中,它也有很多应用的场景,比如出国旅游,看不懂的标语、提示,都可以拍它来识别翻译,不过相比 Google Translate 那种结合了即时翻译 增强现实的技术,TextGrabber还是略逊一筹啦。

如何使用 TextGrabber

TextGrabber 的主界面相当简单,基本就是一个拍照界面。右上角的手电筒可以控制是否开启闪光灯,右上角的剪裁按钮,默认状态下是打开的,即拍照完成后,你可以再对图像进行剪裁,只选取你想识别的那部分。如果关闭的话,拍照后会自动进入到识别过程。点击左下角,可以切换到列表视图,这里存储了所有之前识别的 OCR 结果,右下角则是可以直接从相册中选取图片开始识别。

ocr文字识别后的文档如何编辑(转成可编辑的文本)(1)

ocr文字识别后的文档如何编辑(转成可编辑的文本)(2)

在拍照前,你首先要设置好相应的语言,TextGrabber 本身并不会识别图像中的语言是什么,需要你手动点击屏幕上方中央区域进行设置。它的强大之处就在于,识别的语言种类多达 60 余种,基本上世界主流使用的语言都覆盖了。

之后,你只需要按下拍照键,TextGrabber 会自动帮你对焦,这时候一定要握稳手机避免晃动。很智能的一点是,如果你实在没拿好晃动得十分厉害,TextGrabber 会直接取消这次拍照,你需要重新再次点按开始。

ocr文字识别后的文档如何编辑(转成可编辑的文本)(3)

ocr文字识别后的文档如何编辑(转成可编辑的文本)(4)

之后,就会进入到图像剪裁的步骤,去除和识别无关的部分,会大大提高识别的效率和准确度,这时点击确定,TextGrabber 会有自上而下的蓝色阴影扫描效果,这个过程中不需要联网也能完成识别,而且速度非常之快,一页四五百字的文字,几乎只需要 3-5 秒的时间就可以完成识别了。

ocr文字识别后的文档如何编辑(转成可编辑的文本)(5)

ocr文字识别后的文档如何编辑(转成可编辑的文本)(6)

然后,TextGrabber 就会显示识别的结果。在这里,你可以对识别的文字进行二次编辑,修改一些小错误,另外,它还自带了翻译功能,不过其实是调用 Google 翻译,所以这一过程需要联网,而且翻译的准确性嘛,你懂的。如果文字稍长一些,翻译还可能会失败,实际用处不是非常大,除非是出国旅游,翻译一些简短的句子、提示、菜单还是不错的。

你还可以将识别结果或翻译结果 Twitter、Facebook,或者直接保存到 Evernote。不过试了一下,好像不支持中国区的印象笔记。

ocr文字识别后的文档如何编辑(转成可编辑的文本)(7)

ocr文字识别后的文档如何编辑(转成可编辑的文本)(8)

ocr文字识别后的文档如何编辑(转成可编辑的文本)(9)

识别效果怎么样?

说实话,OCR 要想实现 100% 的准确率,还是相当困难的,不过 TextGrabber 的表现还是大大超出了我的预期,特别是它的识别完全是在本地处理的情况下,不管中文或英文,几乎每一次识别的准确率都达到了 90% 以上。

当然要想提高准确率还是有一定条件的,首先要尽量剔除图片中无关的部分,其次拍摄的时候,文字尽可能要摆正。实测下来,TextGrabber 最大的问题在于对一些中文标点的识别效果很差,经常会变成莫名其妙的英文字母。另一方面,由于 TextGrabber 在识别时并不联网,一些专有的英文词汇、网站名称,本可以自动校正的,但它就爱莫能助了。当然了,对于 OCR 后分段的问题,这几乎是所有同类软件共有的问题,TextGrabber 显然也并不例外。

另外有一个细节也打动了我,本想试试横着拍摄时效果会如何,在第二步看到 TextGrabber 不支持图像翻转,而且识别的动画效果仍然是蓝色阴影从上向下覆盖时,还是有一丝失望的。没想到结果却出人意料,原来 TextGrabber 自己默默地识别出了图像的摆向,识别的结果还是准确的。

ocr文字识别后的文档如何编辑(转成可编辑的文本)(10)

ocr文字识别后的文档如何编辑(转成可编辑的文本)(11)

ocr文字识别后的文档如何编辑(转成可编辑的文本)(12)

总的来说,TextGrabber 的 OCR 效果还是相当不错的,凭借着完全本地识别 60 余种语言的支持,完全将同类软件比了下去,另一方面识别的准确度也相当不错,还是对得起 ABBYY 这块招牌的。加上本周参加了 App Store 的一元冰点活动,实在非常值得入手一个。

目前你可以在 App Store和Google Play下载 TextGrabber。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页