Այս հոդվածը նկարագրում է ինչպես հեռացնել դատարկ էջը Word-ում` օգտագործելով Python: Այն ունի շրջակա միջավայրը կարգավորելու մանրամասներ, քայլերի ցանկ և գործարկվող կոդ, որը ցույց է տալիս ինչպես ջնջել դատարկ էջը Word-ում Python-ի միջոցով: Նմուշի կոդը կարող է օգտագործվել այնպես, ինչպես այն է, առաջադրանքը կատարելու համար, սակայն, անհրաժեշտության դեպքում, դուք կարող եք այն իմպրովիզացնել՝ ավելացնելով տարբեր պայմաններ:
Word-ի դատարկ էջը Python-ի միջոցով ջնջելու քայլեր
- Նախադրեք մշակման միջավայրը, որպեսզի օգտագործի Aspose.Words Python-ի համար .NET-ի միջոցով՝ դատարկ էջերը ջնջելու համար
- Բեռնել սկզբնաղբյուր Word ֆայլը Document օբյեկտի մեջ, որն ունի դատարկ էջեր
- Կրկնեք փաստաթղթի բոլոր էջերը և ստուգեք յուրաքանչյուր բաժնի բովանդակությունը
- Ստուգեք տեքստի և պատկերների առկայությունը և պատրաստեք դատարկ էջերի ցուցակ
- Ստեղծեք նոր դատարկ Word փաստաթուղթ
- Append բոլոր այն էջերը, որոնց վրա որոշակի բովանդակություն կա սկզբնաղբյուր Word ֆայլից, օգտագործելով դատարկ էջերի ցանկը
- Պահպանեք ստացված Word ֆայլը, որը չունի դատարկ էջ
Այս քայլերը բացատրում են ինչպես հեռացնել դատարկ Word էջը Python-ի միջոցով: Այս գործընթացում սկզբնաղբյուր Word ֆայլը բեռնվում է, և յուրաքանչյուր էջի բոլոր բաժինները ստուգվում են՝ տեքստ կամ պատկերներ ունենալու համար՝ դատարկ էջերի ցուցակ պատրաստելու համար: Վերջում ստեղծվում է նոր փաստաթուղթ, և դատարկ էջերից բացի բոլոր էջերը ավելացվում են այս նոր դատարկ փաստաթղթին:
Կոդ՝ Word-ում դատարկ էջը Python-ի միջոցով հեռացնելու համար
import aspose.words as aw | |
import aspose.pydrawing as drawing | |
# Load the license | |
wordLic = aw.License() | |
wordLic.set_license("License.lic") | |
# Load the Word file having blank pages in it | |
originalDocWithFewBlankPages = aw.Document("input.docx") | |
# Declare an array for blank page numbers | |
listOfBlankPageNumbers = [] | |
listOfBlankPageNumbers.append(-1) | |
# Get total pages in the souce Word file | |
totalPagesInOriginalDoc = originalDocWithFewBlankPages.page_count | |
for iCount in range(0, totalPagesInOriginalDoc): # This will loop for page count | |
# Extract each page one by one | |
DocWithOnePage = originalDocWithFewBlankPages.extract_pages(iCount, 1) | |
shapesCounter = 0 | |
pageText = "" | |
# Check text and images in each section | |
for docSection in DocWithOnePage.sections: | |
docSection = docSection.as_section() | |
pageText = pageText + docSection.body.to_string(aw.SaveFormat.TEXT) | |
shapesCounter += docSection.body.get_child_nodes(aw.NodeType.SHAPE, True).count | |
# Check if no content is there | |
if (not pageText) and shapesCounter == 0: | |
# Store the index of blank page numbers | |
listOfBlankPageNumbers.append(iCount) | |
listOfBlankPageNumbers.append(totalPagesInOriginalDoc) | |
# Create a single page document with default forrmat | |
nonEmptyDocument = originalDocWithFewBlankPages.clone(False).as_document() | |
# Clean the document | |
nonEmptyDocument.remove_all_children() | |
# Append the pages with content to the new document | |
for iCount in range(1, len(listOfBlankPageNumbers)): | |
index = listOfBlankPageNumbers[iCount - 1] + 1 | |
count = listOfBlankPageNumbers[iCount] - index | |
if count > 0: | |
nonEmptyDocument.append_document( | |
originalDocWithFewBlankPages.extract_pages(index, count), | |
aw.ImportFormatMode.KEEP_SOURCE_FORMATTING) | |
# Save the document having some content in it | |
nonEmptyDocument.save("NonEmptyPages.docx") | |
print ("Blank pages deleted successfully") |
Այս օրինակելի կոդը ցույց է տալիս ինչպես ջնջել դատարկ էջը Word-ից Python-ի միջոցով: Այս նմուշի կոդում հիմնական տեքստը և SHAPE հանգույցի տեսակը փորձարկվում են յուրաքանչյուր բաժնի համար, սակայն դուք կարող եք օգտագործել այլ տեսակներ, ինչպիսիք են TABLE, COMMENT, FORM_FIELD, SMART_TAG և այլն, դատարկ էջերը նույնականացնելու համար: append_document() մեթոդը օգտագործվում է նոր Word ֆայլում էջեր ավելացնելու համար, մինչդեռ այն պարունակում է տարբեր ծանրաբեռնված մեթոդներ, որոնք թույլ են տալիս տարբեր արգումենտներ էջերի տեղադրման գործընթացի հարմարեցման համար:
Այս հոդվածը մեզ սովորեցրել է ինչպես հեռացնել դատարկ էջը Word-ում Python-ի միջոցով: Եթե ցանկանում եք էջերի համարները տեղադրել Word ֆայլում, տես ինչպես տեղադրել էջի համարը Word-ում Python-ի միջոցով-ի հոդվածը: