Този бърз урок ръководи как да изтриете прекъсване на страница в Word с помощта на Python. Той съдържа подробни стъпки за настройка на средата за разработка, списък с програмни задачи за писане на приложението и примерен код за премахване на всички прекъсвания на страници в Word с помощта на Python. Ще бъдат обсъдени и различни опции за премахване на други видове прекъсвания от файла на Word.
Стъпки за премахване на прекъсвания на страници в Word с помощта на Python
- Настройте средата да използва Aspose.Words за Python чрез .NET за премахване на прекъсвания на страници
- Заредете изходния Word файл в обекта на клас Document и отворете неговия paragraphs
- Преминете през всички абзаци и проверете за прекъсвания на страници преди всеки параграф
- Задайте свойството page_break_before на False, за да премахнете тези прекъсвания на страници
- Анализирайте всички изпълнения във всеки параграф и потърсете контролния знак PAGE_BREAK
- Заменете всички подобни знаци с празни низове, за да ги премахнете от документа
- Запазете получения Word файл, след като изтриете всички прекъсвания на страници
Тези стъпки обобщават процеса за премахване на прекъсвания на страници в Word с помощта на Python. Процесът започва чрез зареждане на изходния файл на Word и достъп до колекцията от параграфи в него за анализ. Всяко свойство page_break_before е зададено на FALSE и всички контролни знаци PAGE_BREAK се заменят с празен низ, преди да се запише получения файл на Word на диска.
Код за изтриване на прекъсване на страница в Word с помощта на Python
import aspose.words as aw | |
import aspose.pydrawing as drawing | |
# Load the license | |
wordLic = aw.License() | |
wordLic.set_license("Aspose.Total.lic") | |
# Load the file | |
word = aw.Document("DocWithPageBreaks.docx") | |
# Access paragraphs | |
paragraphs = word.get_child_nodes(aw.NodeType.PARAGRAPH, True) | |
# Iterate through all paragraphs | |
for obj in paragraphs: | |
paragraph = obj.as_paragraph() | |
# Check page breaks before the paragraph | |
if (paragraph.paragraph_format.page_break_before == True): | |
# Remove it | |
paragraph.paragraph_format.page_break_before = False | |
# Parse all runs | |
for run in paragraph.runs: | |
run = run.as_run(); | |
# Check page break and remove it | |
if (run.get_text() is aw.ControlChar.PAGE_BREAK): | |
run.text = run.get_text().replace(aw.ControlChar.PAGE_BREAK, "") | |
# Save the output | |
word.save("DocxWithoutPageBreaks.docx") | |
print ("Page breaks removed from the document successfully") |
Този код демонстрира как да премахнете всички прекъсвания на страници в Word с помощта на Python. Всеки възел от колекцията параграфи се преобразува в абзац с помощта на метода as_paragraph() и се проверява спрямо свойството page_break_before, за да се зададе на false. Можете да проверите и други контролни знаци, за да ги замените с някои други знаци като COLUMN_BREAK, LINE_BREAK, PARAGRAPH_BREAK и SECTION_BREAK, ако е необходимо.
Тази статия ни научи как да изтриваме прекъсване на страница с помощта на Python. Ако искате да премахнете всички коментари от файл на Word, вижте статията на как да премахнете коментари в Word с помощта на Python.