Ինչպես հանել բոլոր պատկերները Word փաստաթղթից Python-ում

Այս արագ ձեռնարկը պարունակում է տեղեկատվություն ինչպես հանել բոլոր պատկերները Word փաստաթղթից Python-ում: Այն տրամադրում է բոլոր ռեսուրսները՝ կարգավորելու միջավայրը և ներկայացնում է կարևոր API կառուցվածքները, որոնք անհրաժեշտ են առաջադրանքը կատարելու համար, ներառյալ դասերի անունները, մեթոդները և հատկությունները: Դուք կարող եք հետևել քայլերին և գրել ամբողջական ծրագիր՝ պատկերներ Word փաստաթղթից python-ում հանելու համար, օրինակ՝ պատկերներ հանել DOCX ֆայլից և պահել այն որպես պատկերի տեսակ PNG, JPG և այլն: սկավառակի վրա:

Python-ում Word ֆայլից պատկերներ հանելու քայլեր

  1. Կարգավորեք միջավայրը, որպեսզի օգտագործի Aspose.Words Python-ի համար .NET-ի միջոցով պատկերներ հանելու համար
  2. Բեռնել սկզբնաղբյուր Word ֆայլը պատկերներով՝ օգտագործելով Document դասի օբյեկտը
  3. Ստացեք բոլոր ձևերի ցանկը բեռնված փաստաթղթից՝ օգտագործելով get_child_nodes() մեթոդը
  4. Վերլուծեք պատկերների հավաքածուի բոլոր տարրերը և հայտնաբերեք պատկերներ
  5. Ստեղծեք եզակի ֆայլերի անուններ պատկերների հավաքածուի յուրաքանչյուր հայտնաբերված պատկերի համար
  6. Պահպանեք արդյունահանված պատկերը սկավառակի վրա եզակի անունով

Այս քայլերը նկարագրում են Python-ում Word փաստաթղթից նկարներ հանելու գործընթացը՝ կիսելով շրջակա միջավայրի կոնֆիգուրացիան և ծրագիրը գրելու քայլերը: Շրջակա միջավայրը հաստատելուց հետո Word ֆայլը բեռնեք պատկերներով՝ օգտագործելով Document դասի օբյեկտը և դրանից ստացեք բոլոր ձևերի հավաքածուն։ Քանի որ Shape դասը ունի պատկերներ հայտնաբերելու մեթոդներ, դուք կարող եք հանել պատկերները և պահպանել դրանք նշված անունով սկավառակի վրա:

Կոդ՝ Python-ում Word փաստաթղթից լուսանկարներ հանելու համար

import aspose.words as aw
# Load the license
wordProtected = aw.License()
wordProtected.set_license("Aspose.Total.lic")
# Load a document
wordDocument = aw.Document("WordFileWithImages.docx")
# Get shapes collection
allShapes = wordDocument.get_child_nodes(aw.NodeType.SHAPE, True)
# Declare counter for images
index = 0
# Iterate through all the shapes to detect and save images
for shape in allShapes:
# Type cast the node object to shape
shape = shape.as_shape()
if(shape.has_image):
index = index + 1
# Prepare file name using the image counter and image type in the shape object
image_file_name = f"File.extract_images.{index}{aw.FileFormatUtil.image_type_to_extension(shape.image_data.image_type)}"
# Save the extracted image on the disk
shape.image_data.save(image_file_name)
print ("Images extracted successfully from the Word file")

Այստեղ ներկայացվում է կոդը, որը ցույց է տալիս Python-ում Word-ից նկար հանելու գործընթացը*՝ բեռնելով աղբյուրի ֆայլը՝ օգտագործելով Document դասի օբյեկտը, որն ունի բազմաթիվ առանձնահատկություններ, ինչպիսիք են պաշտպանված ֆայլերի գաղտնաբառի տրամադրումը, կոդավորման կարգավորումը և նախազգուշացումը կցելը: հետ կանչեր՝ բեռնման գործընթացը վերահսկելու համար: Նմանապես, get_child_nodes() մեթոդն օգտագործվում է ձևեր հանելու համար, սակայն, դուք կարող եք բեռնել նաև այլ հանգույցներ, ինչպիսիք են վերնագրերը, ստորոտները, աղյուսակները, մեկնաբանությունները, ծանոթագրությունները և հիմնականը և այլն:

Այս հոդվածը մեզ ուղղորդել է վերցնել բոլոր լուսանկարները Word ֆայլից Python-ում: Եթե ցանկանում եք սովորել Word ֆայլում լուսանկար տեղադրելու գործընթացը, տես ինչպես տեղադրել նկար Word-ում Python-ի միջոցով-ի հոդվածը:

 Հայերեն