Как да изтриете прекъсване на страница в Word с помощта на Python

Този бърз урок ръководи как да изтриете прекъсване на страница в Word с помощта на Python. Той съдържа подробни стъпки за настройка на средата за разработка, списък с програмни задачи за писане на приложението и примерен код за премахване на всички прекъсвания на страници в Word с помощта на Python. Ще бъдат обсъдени и различни опции за премахване на други видове прекъсвания от файла на Word.

Стъпки за премахване на прекъсвания на страници в Word с помощта на Python

  1. Настройте средата да използва Aspose.Words за Python чрез .NET за премахване на прекъсвания на страници
  2. Заредете изходния Word файл в обекта на клас Document и отворете неговия paragraphs
  3. Преминете през всички абзаци и проверете за прекъсвания на страници преди всеки параграф
  4. Задайте свойството page_break_before на False, за да премахнете тези прекъсвания на страници
  5. Анализирайте всички изпълнения във всеки параграф и потърсете контролния знак PAGE_BREAK
  6. Заменете всички подобни знаци с празни низове, за да ги премахнете от документа
  7. Запазете получения Word файл, след като изтриете всички прекъсвания на страници

Тези стъпки обобщават процеса за премахване на прекъсвания на страници в Word с помощта на Python. Процесът започва чрез зареждане на изходния файл на Word и достъп до колекцията от параграфи в него за анализ. Всяко свойство page_break_before е зададено на FALSE и всички контролни знаци PAGE_BREAK се заменят с празен низ, преди да се запише получения файл на Word на диска.

Код за изтриване на прекъсване на страница в Word с помощта на Python

import aspose.words as aw
import aspose.pydrawing as drawing
# Load the license
wordLic = aw.License()
wordLic.set_license("Aspose.Total.lic")
# Load the file
word = aw.Document("DocWithPageBreaks.docx")
# Access paragraphs
paragraphs = word.get_child_nodes(aw.NodeType.PARAGRAPH, True)
# Iterate through all paragraphs
for obj in paragraphs:
paragraph = obj.as_paragraph()
# Check page breaks before the paragraph
if (paragraph.paragraph_format.page_break_before == True):
# Remove it
paragraph.paragraph_format.page_break_before = False
# Parse all runs
for run in paragraph.runs:
run = run.as_run();
# Check page break and remove it
if (run.get_text() is aw.ControlChar.PAGE_BREAK):
run.text = run.get_text().replace(aw.ControlChar.PAGE_BREAK, "")
# Save the output
word.save("DocxWithoutPageBreaks.docx")
print ("Page breaks removed from the document successfully")

Този код демонстрира как да премахнете всички прекъсвания на страници в Word с помощта на Python. Всеки възел от колекцията параграфи се преобразува в абзац с помощта на метода as_paragraph() и се проверява спрямо свойството page_break_before, за да се зададе на false. Можете да проверите и други контролни знаци, за да ги замените с някои други знаци като COLUMN_BREAK, LINE_BREAK, PARAGRAPH_BREAK и SECTION_BREAK, ако е необходимо.

Тази статия ни научи как да изтриваме прекъсване на страница с помощта на Python. Ако искате да премахнете всички коментари от файл на Word, вижте статията на как да премахнете коментари в Word с помощта на Python.

 Български