本站消息

  出租广告位,需要合作请联系站长

  今日名言-想象你自己对困难作出的反应,不是逃避或绕开它们,而是面对它们,同它们打交道,以一种进取的和明智的方式同它们奋斗 。——马克斯威尔·马尔兹

  今日名言-用谅解、宽恕的目光和心理看人、待人。人就会觉得葱笼的世界里,春意盎然,到处充满温暖。——蔡文甫


+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

暂无数据

python读doc文档-win32com

发布于2021-07-25 06:58     阅读(420)     评论(0)     点赞(19)     收藏(4)


上一篇提到用python-docx读写.docx文章,但该模块并不能读取.doc文档,这里使用win32com模块,更高级,可以操作word,excel等office文档

一、安装

方法一:官网下载对应python版本的安装程序,网址为:https://sourceforge.net/projects/pywin32/files/pywin32/,下载完成后,双击安装即可

方法二:

pip install pywin32

二、填坑,使用报错:

AttributeError: module 'win32com' has no attribute 'client'

解决:改变导包方式 from win32com import client后可正常执行

三、读取doc/docx文档

  1. from win32com.client import Dispatch
  2. word = Dispatch('Word.Application') # 打开word应用程序
  3. # word = DispatchEx('Word.Application') # 启动独立的进程
  4. word.Visible = 0 # 后台运行,不显示
  5. word.DisplayAlerts = 0 # 不警告
  6. path = r'D:\test\1.doc' # 'D:\test\1.docx'
  7. doc = word.Documents.Open(FileName=path, Encoding='gbk')
  8. for para in doc.paragraphs:
  9. print(para)
  10. doc.Close()
  11. word.Quit()

1.doc的文档内容如下:

输出结果如下:

四、将.doc转换成.docx文件

  1. from win32com.client import Dispatch
  2. word = Dispatch('Word.Application') # 打开word应用程序
  3. # word = DispatchEx('Word.Application') # 启动独立的进程
  4. word.Visible = 0 # 后台运行,不显示
  5. word.DisplayAlerts = 0 # 不警告
  6. doc = word.Documents.Open(r'D:\test\1.doc')
  7. doc.SaveAs(r"D:\test\2.docx", 12) # 另存为后缀为".docx"的文件,其中参数12指doc文件
  8. doc.Close()
  9. word.Quit()

原文链接:https://blog.csdn.net/qq_40006760/article/details/119024320



所属网站分类: 技术文章 > 博客

作者:我想吃麻辣烫

链接:http://www.pythonpdf.com/blog/article/450/d0a240245bc295b1d738/

来源:编程知识网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

19 0
收藏该文
已收藏

评论内容:(最多支持255个字符)