Այս արագ ձեռնարկը պարունակում է տեղեկատվություն ինչպես հանել բոլոր պատկերները Word փաստաթղթից Python-ում: Այն տրամադրում է բոլոր ռեսուրսները՝ կարգավորելու միջավայրը և ներկայացնում է կարևոր API կառուցվածքները, որոնք անհրաժեշտ են առաջադրանքը կատարելու համար, ներառյալ դասերի անունները, մեթոդները և հատկությունները: Դուք կարող եք հետևել քայլերին և գրել ամբողջական ծրագիր՝ պատկերներ Word փաստաթղթից python-ում հանելու համար, օրինակ՝ պատկերներ հանել DOCX ֆայլից և պահել այն որպես պատկերի տեսակ PNG, JPG և այլն: սկավառակի վրա:
Python-ում Word ֆայլից պատկերներ հանելու քայլեր
- Կարգավորեք միջավայրը, որպեսզի օգտագործի Aspose.Words Python-ի համար .NET-ի միջոցով պատկերներ հանելու համար
- Բեռնել սկզբնաղբյուր Word ֆայլը պատկերներով՝ օգտագործելով Document դասի օբյեկտը
- Ստացեք բոլոր ձևերի ցանկը բեռնված փաստաթղթից՝ օգտագործելով get_child_nodes() մեթոդը
- Վերլուծեք պատկերների հավաքածուի բոլոր տարրերը և հայտնաբերեք պատկերներ
- Ստեղծեք եզակի ֆայլերի անուններ պատկերների հավաքածուի յուրաքանչյուր հայտնաբերված պատկերի համար
- Պահպանեք արդյունահանված պատկերը սկավառակի վրա եզակի անունով
Այս քայլերը նկարագրում են Python-ում Word փաստաթղթից նկարներ հանելու գործընթացը՝ կիսելով շրջակա միջավայրի կոնֆիգուրացիան և ծրագիրը գրելու քայլերը: Շրջակա միջավայրը հաստատելուց հետո Word ֆայլը բեռնեք պատկերներով՝ օգտագործելով Document դասի օբյեկտը և դրանից ստացեք բոլոր ձևերի հավաքածուն։ Քանի որ Shape դասը ունի պատկերներ հայտնաբերելու մեթոդներ, դուք կարող եք հանել պատկերները և պահպանել դրանք նշված անունով սկավառակի վրա:
Կոդ՝ Python-ում Word փաստաթղթից լուսանկարներ հանելու համար
import aspose.words as aw | |
# Load the license | |
wordProtected = aw.License() | |
wordProtected.set_license("Aspose.Total.lic") | |
# Load a document | |
wordDocument = aw.Document("WordFileWithImages.docx") | |
# Get shapes collection | |
allShapes = wordDocument.get_child_nodes(aw.NodeType.SHAPE, True) | |
# Declare counter for images | |
index = 0 | |
# Iterate through all the shapes to detect and save images | |
for shape in allShapes: | |
# Type cast the node object to shape | |
shape = shape.as_shape() | |
if(shape.has_image): | |
index = index + 1 | |
# Prepare file name using the image counter and image type in the shape object | |
image_file_name = f"File.extract_images.{index}{aw.FileFormatUtil.image_type_to_extension(shape.image_data.image_type)}" | |
# Save the extracted image on the disk | |
shape.image_data.save(image_file_name) | |
print ("Images extracted successfully from the Word file") |
Այստեղ ներկայացվում է կոդը, որը ցույց է տալիս Python-ում Word-ից նկար հանելու գործընթացը*՝ բեռնելով աղբյուրի ֆայլը՝ օգտագործելով Document դասի օբյեկտը, որն ունի բազմաթիվ առանձնահատկություններ, ինչպիսիք են պաշտպանված ֆայլերի գաղտնաբառի տրամադրումը, կոդավորման կարգավորումը և նախազգուշացումը կցելը: հետ կանչեր՝ բեռնման գործընթացը վերահսկելու համար: Նմանապես, get_child_nodes() մեթոդն օգտագործվում է ձևեր հանելու համար, սակայն, դուք կարող եք բեռնել նաև այլ հանգույցներ, ինչպիսիք են վերնագրերը, ստորոտները, աղյուսակները, մեկնաբանությունները, ծանոթագրությունները և հիմնականը և այլն:
Այս հոդվածը մեզ ուղղորդել է վերցնել բոլոր լուսանկարները Word ֆայլից Python-ում: Եթե ցանկանում եք սովորել Word ֆայլում լուսանկար տեղադրելու գործընթացը, տես ինչպես տեղադրել նկար Word-ում Python-ի միջոցով-ի հոդվածը: