Як видалити розрив сторінки в Word за допомогою Python

У цьому короткому посібнику описано, як видалити розрив сторінки в Word за допомогою Python. Він містить докладні кроки для налаштування середовища розробки, список програмних завдань для написання програми та приклад коду, який можна виконати, щоб видалити всі розриви сторінок у Word за допомогою Python. Також будуть обговорені різні варіанти видалення інших типів розривів із файлу Word.

Кроки для усунення розривів сторінок у Word за допомогою Python

  1. Налаштуйте середовище на використання Aspose.Words для Python через .NET для видалення розривів сторінок
  2. Завантажте вихідний файл Word в об’єкт класу Document і отримайте доступ до його paragraphs
  3. Перегляньте всі абзаци та перевірте наявність розривів сторінок перед кожним абзацом
  4. Установіть для властивості page_break_before значення False, щоб видалити ці розриви сторінок
  5. Проаналізуйте всі прогони в кожному абзаці та знайдіть контрольний символ PAGE_BREAK
  6. Замініть усі такі символи порожніми рядками, щоб видалити їх із документа
  7. Збережіть отриманий файл Word після видалення всіх розривів сторінок

Ці кроки підсумовують процес видалення розривів сторінок у Word за допомогою Python. Процес починається із завантаження вихідного файлу Word і доступу до колекції абзаців у ньому для аналізу. Для кожної властивості page_break_before встановлено значення FALSE, і всі контрольні символи PAGE_BREAK замінюються порожнім рядком перед збереженням результуючого файлу Word на диску.

Код для видалення розриву сторінки в Word за допомогою Python

import aspose.words as aw
import aspose.pydrawing as drawing
# Load the license
wordLic = aw.License()
wordLic.set_license("Aspose.Total.lic")
# Load the file
word = aw.Document("DocWithPageBreaks.docx")
# Access paragraphs
paragraphs = word.get_child_nodes(aw.NodeType.PARAGRAPH, True)
# Iterate through all paragraphs
for obj in paragraphs:
paragraph = obj.as_paragraph()
# Check page breaks before the paragraph
if (paragraph.paragraph_format.page_break_before == True):
# Remove it
paragraph.paragraph_format.page_break_before = False
# Parse all runs
for run in paragraph.runs:
run = run.as_run();
# Check page break and remove it
if (run.get_text() is aw.ControlChar.PAGE_BREAK):
run.text = run.get_text().replace(aw.ControlChar.PAGE_BREAK, "")
# Save the output
word.save("DocxWithoutPageBreaks.docx")
print ("Page breaks removed from the document successfully")

Цей код демонструє як видалити всі розриви сторінок у Word за допомогою Python. Кожен вузол із колекції абзаців перетворюється на абзац за допомогою методу as_paragraph() і перевіряється на властивість page_break_before, щоб встановити для неї значення false. Ви також можете перевірити інші контрольні символи, щоб замінити їх деякими іншими символами, наприклад COLUMN_BREAK, LINE_BREAK, PARAGRAPH_BREAK і SECTION_BREAK, якщо потрібно.

Ця стаття навчила нас як видалити розрив сторінки за допомогою Python. Якщо ви хочете видалити всі коментарі з файлу Word, зверніться до статті як видалити коментарі в Word за допомогою Python.

 Українська