python写入文件的操作方法(python利用python读取DOC文件)

近期公司需要处理一批DOC文件,而在windows系统中,python没有模块能直接读取doc文件。需要先把doc文件批量转成docx文件,再读取操作。linux系统python有模块可直接读取doc文件,下次再分享。

python如何将doc文件如何转docx文件

首先安装win32com。

下载地址,https://github.com/mhammond/pywin32/releases。自行下载合适版本安装

python写入文件的操作方法(python利用python读取DOC文件)(1)

转换代码如下

from win32com import client as wc w = wc.Dispatch('Word.Application') # 或用下面方法,使用启动独立的进程 # w = wc.DispathchEx('Word.Application') doc = w.Documents.Open('E:/测试.doc') doc.SaveAs('E:/测试.docx', 16) # 参数16必须要写,否则报错

转换完成之后,有多种方法可以读取docx文件里面的内容及格式,例如使用python-docx。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页