利用python来对pdf文档转化(看程序猿怎么用简单的几行python代码实现)
不啰嗦,直接上代码:
def merger():
in_path = r"D:\Desktop\11\新建文件夹"
out_path = os.path.split(in_path)[0]
#获取文件夹所有文件
all_File = get_allfile(in_path)
concatenate2(all_file,out_path "\\合并文件.pdf")
#文件合并2
def concatenate2(paths,output):
writer = PdfFileMerger()
for path in paths:
writer.append(path,import_bookmarks=False)
writer.write(output)
writer.close()
如果你跟我一样是坐在办公室做资料的,pdf文件合并是经常要干的一件事。
当然你可能会觉得,这么简单的文件合并,用Adobe Acrobat Pro 就可以轻松完成了,何必要大费周章用python。
是的,处理pdf文件Adobe Acrobat Pro几乎是必备的,简单的合并当然用它就够了。但是用Adobe Acrobat Pro合并比较大的pdf文件的时候,经常就会出现 “正在合并重复的字体” 的提示,这时候常常等很久也合并不成功。用这个小工具来合并就没有这种问题了,而且大批量合并的时候速度更快。
合并文件出现的问题
当然这个小工具只是抛砖引玉,当你遇到大批量又比较复杂的合并的时候,改写下这个小工具,会让你的工作事半功倍。
例如我下面针对我的一个工作内容,简单改写的案例:
工作内容:
在 “new_file_1” 文件中有116个pdf文件,同样在“sign”的文件夹中也有116个文件。这两个文件夹中的116个pdf文件的名称是一样的(之前拆分出来打印签名,现在要再合并回去),现在需要将这两个文件的pdf文件一一对应的进行合并,合并好的文件再以同样的文件名称保存到“sign2”的文件夹中。
文件夹
批量pdf文件
改写的代码:
def merger2():
in_path = r"D:\完全共享\追溯表\2021\沃利\完工资料扫描版\01格栅布置图\new_file_1"
in_path2 = r"D:\完全共享\追溯表\2021\沃利\完工资料扫描版\01格栅布置图\sign"
out_path = r"D:\完全共享\追溯表\2021\沃利\完工资料扫描版\01格栅布置图\sign2"
for fileName in get_allfile(in_path):
#获取文件夹所有文件
all_file = [fileName,in_path2 "\\" os.path.split(fileName)[1]]
concatenate2(all_file,out_path "\\" os.path.split(fileName)[1])
类似这样批量的工作,用Adobe Acrobat Pro去一个个手动合并,是不是得累死条狗。
简单地改写下工具代码,就能迅速提供你的工作效率。所以赶紧收藏起来吧,或许哪天你也能派上用场了。
,免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com