如何使用 Python 删除 Word 中的分页符

本快速教程指导如何使用 Python 删除 Word 中的分页符。它包含设置开发环境的详细步骤、编写应用程序的编程任务列表以及用于使用 Python 删除 Word 中的所有分页符的可运行示例代码。还将讨论从 Word 文件中删除其他类型的中断的不同选项。

使用 Python 消除 Word 中的分页符的步骤

  1. 设置环境以使用 通过 .NET 的 Aspose.Words for Python 删除分页符
  2. 将源 Word 文件加载到 Document 类对象并访问其 paragraphs
  3. 遍历所有段落并检查每个段落之前的分页符
  4. 将 page_break_before 属性设置为 False 以删除这些分页符
  5. 解析每个段落中的所有运行并查找 PAGE_BREAK 控制字符
  6. 用空字符串替换所有此类字符以将它们从文档中删除
  7. 删除所有分页符后保存生成的 Word 文件

这些步骤总结了使用 Python* 在 Word 中*删除分页符的过程。该过程首先加载源 Word 文件并访问其中的段落集合以进行解析。每个 page_break_before 属性都设置为 FALSE,并且在将生成的 Word 文件保存到磁盘之前,所有 PAGE_BREAK 控制字符都被替换为空字符串。

使用 Python 在 Word 中删除分页符的代码

import aspose.words as aw
import aspose.pydrawing as drawing
# Load the license
wordLic = aw.License()
wordLic.set_license("Aspose.Total.lic")
# Load the file
word = aw.Document("DocWithPageBreaks.docx")
# Access paragraphs
paragraphs = word.get_child_nodes(aw.NodeType.PARAGRAPH, True)
# Iterate through all paragraphs
for obj in paragraphs:
paragraph = obj.as_paragraph()
# Check page breaks before the paragraph
if (paragraph.paragraph_format.page_break_before == True):
# Remove it
paragraph.paragraph_format.page_break_before = False
# Parse all runs
for run in paragraph.runs:
run = run.as_run();
# Check page break and remove it
if (run.get_text() is aw.ControlChar.PAGE_BREAK):
run.text = run.get_text().replace(aw.ControlChar.PAGE_BREAK, "")
# Save the output
word.save("DocxWithoutPageBreaks.docx")
print ("Page breaks removed from the document successfully")

此代码演示如何使用 Python 删除 Word 中的所有分页符。 paragraphs 集合中的每个节点都使用 as_paragraph() 方法转换为一个段落,并检查属性 page_break_before 以将其设置为 false。如果需要,您还可以检查其他控制字符以将它们替换为其他一些字符,如 COLUMN_BREAK、LINE_BREAK、PARAGRAPH_BREAK 和 SECTION_BREAK。

本文教会了我们如何使用 Python 删除分页符。如果您想从 Word 文件中删除所有评论,请参阅 如何使用 Python 删除 Word 中的注释 上的文章。

 简体中文