利用python来对pdf文档转化(看程序猿怎么用简单的几行python代码实现)

利用python来对pdf文档转化(看程序猿怎么用简单的几行python代码实现)(1)

不啰嗦,直接上代码:

def merger():

in_path = r"D:\Desktop\11\新建文件夹"

out_path = os.path.split(in_path)[0]

#获取文件夹所有文件

all_File = get_allfile(in_path)

concatenate2(all_file,out_path "\\合并文件.pdf")

#文件合并2

def concatenate2(paths,output):

writer = PdfFileMerger()

for path in paths:

writer.append(path,import_bookmarks=False)

writer.write(output)

writer.close()

如果你跟我一样是坐在办公室做资料的,pdf文件合并是经常要干的一件事。

当然你可能会觉得,这么简单的文件合并,用Adobe Acrobat Pro 就可以轻松完成了,何必要大费周章用python。

是的,处理pdf文件Adobe Acrobat Pro几乎是必备的,简单的合并当然用它就够了。但是用Adobe Acrobat Pro合并比较大的pdf文件的时候,经常就会出现 “正在合并重复的字体” 的提示,这时候常常等很久也合并不成功。用这个小工具来合并就没有这种问题了,而且大批量合并的时候速度更快。

利用python来对pdf文档转化(看程序猿怎么用简单的几行python代码实现)(2)

合并文件出现的问题

当然这个小工具只是抛砖引玉,当你遇到大批量又比较复杂的合并的时候,改写下这个小工具,会让你的工作事半功倍。

例如我下面针对我的一个工作内容,简单改写的案例:

工作内容:

在 “new_file_1” 文件中有116个pdf文件,同样在“sign”的文件夹中也有116个文件。这两个文件夹中的116个pdf文件的名称是一样的(之前拆分出来打印签名,现在要再合并回去),现在需要将这两个文件的pdf文件一一对应的进行合并,合并好的文件再以同样的文件名称保存到“sign2”的文件夹中。

利用python来对pdf文档转化(看程序猿怎么用简单的几行python代码实现)(3)

文件夹

利用python来对pdf文档转化(看程序猿怎么用简单的几行python代码实现)(4)

批量pdf文件

改写的代码:

def merger2():

in_path = r"D:\完全共享\追溯表\2021\沃利\完工资料扫描版\01格栅布置图\new_file_1"

in_path2 = r"D:\完全共享\追溯表\2021\沃利\完工资料扫描版\01格栅布置图\sign"

out_path = r"D:\完全共享\追溯表\2021\沃利\完工资料扫描版\01格栅布置图\sign2"

for fileName in get_allfile(in_path):

#获取文件夹所有文件

all_file = [fileName,in_path2 "\\" os.path.split(fileName)[1]]

concatenate2(all_file,out_path "\\" os.path.split(fileName)[1])

类似这样批量的工作,用Adobe Acrobat Pro去一个个手动合并,是不是得累死条狗。

简单地改写下工具代码,就能迅速提供你的工作效率。所以赶紧收藏起来吧,或许哪天你也能派上用场了。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页