简介
处于某些上下游对接需求,所以需要频繁的将生信的分析结果整理成PPT文件,以便进行结果的展示。所以基于该模块可以更方便的在集群上自动化生成相关的文档示例,用于进行后续的处理。
使用python操作PPT,需要使用的模块就是python-pptx,下面来对该模块做一个简单的介绍。
这里提前做一个说明:python操作PPT,最好是我们提前设计好自己的一套样式,然后利用进行python进行内容的获取和填充(最主要的功能!),最好是不用使用python代码操作PPT的格式,格式的修改肯定不如我们直接在PPT中修改方便。
可以创建、修改PPT(.pptx)文件。
环境准备
模块的安装
需要单独安装,不包含在Python标准模块里
1 | # "Windows用户命令行下输入" |
模块的导入
1 | import pptx |
模块的使用
python读取PPT文档中的内容
在使用python操作PPT之前,首先应该清楚PPT的结构,这个对于之后代码的编写很有帮助。
获取Slide
1 | from pptx import Presentation |
获取Shape形状
1 | import pptx |
判断每个Shape中是否存在文字
- shape.has_text_frame :是否有文字
- shape.text_frame :获取文字框
1 | import pptx |
获取某一页Slide中的内容
1 | import pptx |
获取Shape中的某个Paragraph
1 | import pptx |