免费获取pdf文件(暑期福利大放送)

八月已经过半,九(开)月(学)还会远吗!

马上又要开始在pdf中扒表格、扒数据的日日日日日子了

你有木有过这种体验

原本在PDF里面乖乖排好的表格,复制粘贴到excel时全都变!了!样!

怎!么!办!

小匠决定给小伙伴们介绍几款神器.....

1

Tabula

免费获取pdf文件(暑期福利大放送)(1)

http://tabula.technology/

这是一款可以直接下载安装到电脑上的免费软件。允许用户先上传一整份PDF文档,再选择其中的表格,一次导出单个或多个均可。输出的格式包括CSV和JASON的TSV,便于之后再用Excel、Google Sheet或Libre Office Calc等软件打开。

缺点:

1. pdf必须是文字型的,图片的pdf或者横向放置的表格则无法处理。

2. Tabula不能做到光学字符识别,偶尔导出的数据会有乱码,因此在你导入相应的PDF文件之后,你需要手动将需要的表格框出来,Tabula会试图在保留行列的前提下转化数据;或者在导出页面,将数据复制粘贴到excel也可以解决这个问题。

2

Cometdocs

免费获取pdf文件(暑期福利大放送)(2)

https://www.cometdocs.com

费用:

1.美国的调查新闻从业人员可以免费成为其高级会员。

2.对于普通用户,Cometdocs可以每周免费转换五份PDF文档,超过这个数量就要收费,价格是每月9.99美元。如果一次性支付130美元则可以终身使用。

Cometdocs是用于从PDF中抓取表格数据最简单有效的工具。用户可以直接进入网站,上传文件,选择输出文件格式是Excel或ODS(用于Libre Office软件),输入你的邮件地址即可完成。其支持光学字符识别(Optical Character Recognition, OCR)技术,可以用于经扫描生成的PDF文档(由于其未必百分百准确,所以转换后仍需仔细检查一遍。)。

缺点:

1.不能免费处理图片,需要订购OCR服务。

2.不支持CSV格式。与Tabula一样,Cometdocs不能识别横向放置的表格。

3

SCRAPER WIKI

免费获取pdf文件(暑期福利大放送)(3)

https://scraperwiki.com/

scraperwiki有一个免费的社区版,未注册时可以得到25页的免费转换页数,注册后可得到50页的免费转换页数。官网显示500页需要15美元购买,2500页需要50美元,5000页则需要100美元。

Tabula在上传完成后,要求用户在PDF文档中标注想要转换的部分,而ScraperWiki在上传过程中就完成了转换。

4

Adobe Export PDF

费用:付费使用,24美元一年

与Tabula类似,Export PDF可以快速处理大文档。

并且可以在官方阅读软件Adobe Reader上使用该转换工具,转换后直接用Excel、Word、PowerPoint或RTF打开新文档。

缺点:不适用于扫描件或横向转置的表格。

5

Nitro Pro

免费获取pdf文件(暑期福利大放送)(4)

https://www.gonitro.com

Nitro Pro适合商业人士,功能强大但价格不菲,大约需要160美元。其缺点是只能用于Windows操作系统,将广大MacBook用户排除在外。

6

Acrobat Pro

同样是PDF官方出品,Windows和Mac均适用,但每月收费15美元,而且最少要订购一年。

7

Zanran

免费获取pdf文件(暑期福利大放送)(5)

https://pdf.zanran.com/

同样是收费软件,但可以试用,只要文件小于1.5MB,并提供你的邮箱。转换后的文件将以电子邮件的形式发送给你。

8

zamzar

免费获取pdf文件(暑期福利大放送)(6)

http://www.zamzar.com/

同样是需要用邮箱接收文件的网上软件,但好处是免费使用。

以上内容来自文章《How to extract data from a PDF》《The beginner’s guide to extracting data from PDFs》等

编辑:余媛

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页