نحوه حذف صفحه خالی در ورد با استفاده از پایتون

این مقاله نحوه حذف صفحه خالی در Word با استفاده از Python را شرح می‌دهد. دارای جزئیات تنظیم محیط، فهرستی از مراحل و یک کد نمونه قابل اجرا است که چگونگی حذف صفحه خالی در Word با استفاده از پایتون را نشان می دهد. کد نمونه را می توان همانطور که هست برای انجام کار استفاده کرد، با این حال، در صورت نیاز می توانید با اضافه کردن شرایط مختلف آن را بدیهی کنید.

مراحل حذف صفحه خالی در Word با استفاده از پایتون

  1. محیط توسعه را طوری تنظیم کنید که از Aspose.Words برای پایتون از طریق دات نت برای حذف صفحات خالی استفاده کند
  2. فایل Word منبع را در شیء Document با صفحات خالی بارگیری کنید
  3. تمام صفحات سند را تکرار کنید و محتوای هر بخش را بررسی کنید
  4. وجود متن و تصاویر را بررسی کنید و لیستی از صفحات خالی تهیه کنید
  5. یک سند Word خالی جدید ایجاد کنید
  6. Append همه صفحاتی که دارای محتوایی از فایل Word منبع هستند با استفاده از لیست صفحات خالی
  7. فایل Word حاصل را بدون صفحه خالی ذخیره کنید

این مراحل فرآیند نحوه حذف صفحه خالی Word با استفاده از پایتون را توضیح می دهد. در این فرآیند فایل ورد منبع بارگذاری می شود و تمامی قسمت های هر صفحه از نظر داشتن متن یا تصویر بررسی می شود تا لیستی از صفحات خالی تهیه شود. در پایان یک سند جدید ایجاد می شود و تمام صفحات غیر از صفحات خالی به این سند جدید خالی اضافه می شوند.

کد حذف صفحه خالی در ورد با استفاده از پایتون

import aspose.words as aw
import aspose.pydrawing as drawing
# Load the license
wordLic = aw.License()
wordLic.set_license("License.lic")
# Load the Word file having blank pages in it
originalDocWithFewBlankPages = aw.Document("input.docx")
# Declare an array for blank page numbers
listOfBlankPageNumbers = []
listOfBlankPageNumbers.append(-1)
# Get total pages in the souce Word file
totalPagesInOriginalDoc = originalDocWithFewBlankPages.page_count
for iCount in range(0, totalPagesInOriginalDoc): # This will loop for page count
# Extract each page one by one
DocWithOnePage = originalDocWithFewBlankPages.extract_pages(iCount, 1)
shapesCounter = 0
pageText = ""
# Check text and images in each section
for docSection in DocWithOnePage.sections:
docSection = docSection.as_section()
pageText = pageText + docSection.body.to_string(aw.SaveFormat.TEXT)
shapesCounter += docSection.body.get_child_nodes(aw.NodeType.SHAPE, True).count
# Check if no content is there
if (not pageText) and shapesCounter == 0:
# Store the index of blank page numbers
listOfBlankPageNumbers.append(iCount)
listOfBlankPageNumbers.append(totalPagesInOriginalDoc)
# Create a single page document with default forrmat
nonEmptyDocument = originalDocWithFewBlankPages.clone(False).as_document()
# Clean the document
nonEmptyDocument.remove_all_children()
# Append the pages with content to the new document
for iCount in range(1, len(listOfBlankPageNumbers)):
index = listOfBlankPageNumbers[iCount - 1] + 1
count = listOfBlankPageNumbers[iCount] - index
if count > 0:
nonEmptyDocument.append_document(
originalDocWithFewBlankPages.extract_pages(index, count),
aw.ImportFormatMode.KEEP_SOURCE_FORMATTING)
# Save the document having some content in it
nonEmptyDocument.save("NonEmptyPages.docx")
print ("Blank pages deleted successfully")

این کد نمونه چگونه صفحه خالی را از ورد با استفاده از پایتون حذف کنید را نشان می دهد. در این کد نمونه، متن اصلی و نوع گره SHAPE برای هر بخش آزمایش می‌شود، اما می‌توانید از انواع دیگری مانند TABLE، COMMENT، FORM_FIELD، SMART_TAG و غیره برای شناسایی صفحات خالی استفاده کنید. متد ()append_document برای افزودن صفحات به فایل ورد جدید استفاده می‌شود، در حالی که شامل روش‌های بارگذاری‌شده مختلفی است که به آرگومان‌های مختلف برای سفارشی‌سازی فرآیند درج صفحه اجازه می‌دهد.

این مقاله به ما آموزش داده است چگونه صفحه خالی در Word را با استفاده از پایتون حذف کنیم. اگر می خواهید شماره صفحات را در فایل Word قرار دهید، به مقاله نحوه قرار دادن شماره صفحه در ورد با استفاده از پایتون مراجعه کنید.

 فارسی