У цьому короткому посібнику описано, як видалити розрив сторінки в Word за допомогою Python. Він містить докладні кроки для налаштування середовища розробки, список програмних завдань для написання програми та приклад коду, який можна виконати, щоб видалити всі розриви сторінок у Word за допомогою Python. Також будуть обговорені різні варіанти видалення інших типів розривів із файлу Word.
Кроки для усунення розривів сторінок у Word за допомогою Python
- Налаштуйте середовище на використання Aspose.Words для Python через .NET для видалення розривів сторінок
- Завантажте вихідний файл Word в об’єкт класу Document і отримайте доступ до його paragraphs
- Перегляньте всі абзаци та перевірте наявність розривів сторінок перед кожним абзацом
- Установіть для властивості page_break_before значення False, щоб видалити ці розриви сторінок
- Проаналізуйте всі прогони в кожному абзаці та знайдіть контрольний символ PAGE_BREAK
- Замініть усі такі символи порожніми рядками, щоб видалити їх із документа
- Збережіть отриманий файл Word після видалення всіх розривів сторінок
Ці кроки підсумовують процес видалення розривів сторінок у Word за допомогою Python. Процес починається із завантаження вихідного файлу Word і доступу до колекції абзаців у ньому для аналізу. Для кожної властивості page_break_before встановлено значення FALSE, і всі контрольні символи PAGE_BREAK замінюються порожнім рядком перед збереженням результуючого файлу Word на диску.
Код для видалення розриву сторінки в Word за допомогою Python
import aspose.words as aw | |
import aspose.pydrawing as drawing | |
# Load the license | |
wordLic = aw.License() | |
wordLic.set_license("Aspose.Total.lic") | |
# Load the file | |
word = aw.Document("DocWithPageBreaks.docx") | |
# Access paragraphs | |
paragraphs = word.get_child_nodes(aw.NodeType.PARAGRAPH, True) | |
# Iterate through all paragraphs | |
for obj in paragraphs: | |
paragraph = obj.as_paragraph() | |
# Check page breaks before the paragraph | |
if (paragraph.paragraph_format.page_break_before == True): | |
# Remove it | |
paragraph.paragraph_format.page_break_before = False | |
# Parse all runs | |
for run in paragraph.runs: | |
run = run.as_run(); | |
# Check page break and remove it | |
if (run.get_text() is aw.ControlChar.PAGE_BREAK): | |
run.text = run.get_text().replace(aw.ControlChar.PAGE_BREAK, "") | |
# Save the output | |
word.save("DocxWithoutPageBreaks.docx") | |
print ("Page breaks removed from the document successfully") |
Цей код демонструє як видалити всі розриви сторінок у Word за допомогою Python. Кожен вузол із колекції абзаців перетворюється на абзац за допомогою методу as_paragraph() і перевіряється на властивість page_break_before, щоб встановити для неї значення false. Ви також можете перевірити інші контрольні символи, щоб замінити їх деякими іншими символами, наприклад COLUMN_BREAK, LINE_BREAK, PARAGRAPH_BREAK і SECTION_BREAK, якщо потрібно.
Ця стаття навчила нас як видалити розрив сторінки за допомогою Python. Якщо ви хочете видалити всі коментарі з файлу Word, зверніться до статті як видалити коментарі в Word за допомогою Python.