Artikel ini menjelaskan cara menghapus halaman kosong di Word menggunakan Python. Ini memiliki detail untuk mengatur lingkungan, daftar langkah, dan kode contoh yang dapat dijalankan yang menunjukkan cara menghapus halaman kosong di Word menggunakan Python. Kode contoh dapat digunakan apa adanya untuk melakukan tugas, namun Anda dapat melakukan improvisasi dengan menambahkan kondisi berbeda jika diperlukan.
Langkah-langkah Menghapus Halaman Kosong di Word menggunakan Python
- Atur lingkungan pengembangan agar menggunakan Aspose.Words untuk Python melalui .NET untuk menghapus halaman kosong
- Muat file Word sumber ke objek Document yang memiliki halaman kosong di dalamnya
- Ulangi semua halaman dalam dokumen dan periksa konten setiap bagian
- Periksa keberadaan teks dan gambar dan siapkan daftar halaman kosong
- Buat dokumen Word kosong baru
- Append semua halaman yang memiliki beberapa konten di dalamnya dari file Word sumber menggunakan daftar halaman kosong
- Simpan file Word yang dihasilkan tanpa halaman kosong
Langkah-langkah ini menjelaskan proses cara menghapus halaman Word kosong menggunakan Python. Dalam proses ini, file sumber Word dimuat dan semua bagian di setiap halaman diperiksa untuk mengetahui adanya teks atau gambar untuk menyiapkan daftar halaman kosong. Pada akhirnya, dokumen baru dibuat dan semua halaman selain halaman kosong ditambahkan ke dokumen kosong baru ini.
Kode untuk Menghapus Halaman Kosong di Word menggunakan Python
import aspose.words as aw | |
import aspose.pydrawing as drawing | |
# Load the license | |
wordLic = aw.License() | |
wordLic.set_license("License.lic") | |
# Load the Word file having blank pages in it | |
originalDocWithFewBlankPages = aw.Document("input.docx") | |
# Declare an array for blank page numbers | |
listOfBlankPageNumbers = [] | |
listOfBlankPageNumbers.append(-1) | |
# Get total pages in the souce Word file | |
totalPagesInOriginalDoc = originalDocWithFewBlankPages.page_count | |
for iCount in range(0, totalPagesInOriginalDoc): # This will loop for page count | |
# Extract each page one by one | |
DocWithOnePage = originalDocWithFewBlankPages.extract_pages(iCount, 1) | |
shapesCounter = 0 | |
pageText = "" | |
# Check text and images in each section | |
for docSection in DocWithOnePage.sections: | |
docSection = docSection.as_section() | |
pageText = pageText + docSection.body.to_string(aw.SaveFormat.TEXT) | |
shapesCounter += docSection.body.get_child_nodes(aw.NodeType.SHAPE, True).count | |
# Check if no content is there | |
if (not pageText) and shapesCounter == 0: | |
# Store the index of blank page numbers | |
listOfBlankPageNumbers.append(iCount) | |
listOfBlankPageNumbers.append(totalPagesInOriginalDoc) | |
# Create a single page document with default forrmat | |
nonEmptyDocument = originalDocWithFewBlankPages.clone(False).as_document() | |
# Clean the document | |
nonEmptyDocument.remove_all_children() | |
# Append the pages with content to the new document | |
for iCount in range(1, len(listOfBlankPageNumbers)): | |
index = listOfBlankPageNumbers[iCount - 1] + 1 | |
count = listOfBlankPageNumbers[iCount] - index | |
if count > 0: | |
nonEmptyDocument.append_document( | |
originalDocWithFewBlankPages.extract_pages(index, count), | |
aw.ImportFormatMode.KEEP_SOURCE_FORMATTING) | |
# Save the document having some content in it | |
nonEmptyDocument.save("NonEmptyPages.docx") | |
print ("Blank pages deleted successfully") |
Kode contoh ini menunjukkan cara menghapus halaman kosong dari Word menggunakan Python. Dalam kode contoh ini, teks isi dan tipe node SHAPE diuji untuk setiap bagian namun Anda dapat menggunakan tipe lain seperti TABLE, COMMENT, FORM_FIELD, SMART_TAG, dll. untuk mengidentifikasi halaman kosong. Metode append_document() digunakan untuk menambahkan halaman ke file Word baru, sedangkan metode ini berisi berbagai metode kelebihan beban yang memungkinkan argumen berbeda untuk penyesuaian proses penyisipan halaman.
Artikel ini telah mengajari kita cara menghapus halaman kosong di Word menggunakan Python. Jika Anda ingin memasukkan nomor halaman pada file Word, lihat artikel di cara memasukkan nomor halaman di Word menggunakan Python.