本快速教程指导如何使用 Python 删除 Word 中的分页符。它包含设置开发环境的详细步骤、编写应用程序的编程任务列表以及用于使用 Python 删除 Word 中的所有分页符的可运行示例代码。还将讨论从 Word 文件中删除其他类型的中断的不同选项。
使用 Python 消除 Word 中的分页符的步骤
- 设置环境以使用 通过 .NET 的 Aspose.Words for Python 删除分页符
- 将源 Word 文件加载到 Document 类对象并访问其 paragraphs
- 遍历所有段落并检查每个段落之前的分页符
- 将 page_break_before 属性设置为 False 以删除这些分页符
- 解析每个段落中的所有运行并查找 PAGE_BREAK 控制字符
- 用空字符串替换所有此类字符以将它们从文档中删除
- 删除所有分页符后保存生成的 Word 文件
这些步骤总结了使用 Python* 在 Word 中*删除分页符的过程。该过程首先加载源 Word 文件并访问其中的段落集合以进行解析。每个 page_break_before 属性都设置为 FALSE,并且在将生成的 Word 文件保存到磁盘之前,所有 PAGE_BREAK 控制字符都被替换为空字符串。
使用 Python 在 Word 中删除分页符的代码
import aspose.words as aw | |
import aspose.pydrawing as drawing | |
# Load the license | |
wordLic = aw.License() | |
wordLic.set_license("Aspose.Total.lic") | |
# Load the file | |
word = aw.Document("DocWithPageBreaks.docx") | |
# Access paragraphs | |
paragraphs = word.get_child_nodes(aw.NodeType.PARAGRAPH, True) | |
# Iterate through all paragraphs | |
for obj in paragraphs: | |
paragraph = obj.as_paragraph() | |
# Check page breaks before the paragraph | |
if (paragraph.paragraph_format.page_break_before == True): | |
# Remove it | |
paragraph.paragraph_format.page_break_before = False | |
# Parse all runs | |
for run in paragraph.runs: | |
run = run.as_run(); | |
# Check page break and remove it | |
if (run.get_text() is aw.ControlChar.PAGE_BREAK): | |
run.text = run.get_text().replace(aw.ControlChar.PAGE_BREAK, "") | |
# Save the output | |
word.save("DocxWithoutPageBreaks.docx") | |
print ("Page breaks removed from the document successfully") |
此代码演示如何使用 Python 删除 Word 中的所有分页符。 paragraphs 集合中的每个节点都使用 as_paragraph() 方法转换为一个段落,并检查属性 page_break_before 以将其设置为 false。如果需要,您还可以检查其他控制字符以将它们替换为其他一些字符,如 COLUMN_BREAK、LINE_BREAK、PARAGRAPH_BREAK 和 SECTION_BREAK。
本文教会了我们如何使用 Python 删除分页符。如果您想从 Word 文件中删除所有评论,请参阅 如何使用 Python 删除 Word 中的注释 上的文章。