Այս արագ ձեռնարկը բացատրում է ինչպես փոխարկել PDF-ը Text-ի` օգտագործելով Python: Այն ընդգրկում է համակարգի կազմաձևման մանրամասները և քայլ առ քայլ գործընթացը, օրինակելի կոդի հետ միասին՝ PDF-ից տեքստ Python-ի վրա հիմնված փոխակերպումը կատարելու համար: Ավելին, դուք կարող եք արդյունահանված տեքստը գրել ֆայլում կամ վահանակում՝ ըստ ձեր պահանջների:
Python-ում PDF-ը տեքստի փոխարկելու քայլեր
- Կարգավորեք համակարգը՝ տեղադրելով Aspose.PDF Python-ի համար .NET-ի միջոցով գրադարանը
- Բեռնեք սկզբնաղբյուր PDF ֆայլը՝ օգտագործելով Document դասը՝ այն Տեքստային ֆայլի փոխարկելու համար
- Ստեղծեք TextAbsorber դասի օբյեկտ՝ Page.Accept() մեթոդով տեքստ ստանալու համար
- Ստեղծեք տեքստային ֆայլ և գրեք ելքային տեքստային տողը ֆայլում
Այս քայլերն ամփոփում են, թե ինչպես կարելի է օգտագործել Python PDF-ը TXT փոխակերպումը API-ի մի քանի զանգերի միջոցով: Առաջին քայլում բեռնեք մուտքագրված PDF ֆայլը և սկզբնավորեք TextAbsorber-ի օբյեկտը, որը կարող է օգտագործվել էջերից տեքստ բերելու համար: Այնուհետև դուք պետք է ստանաք արդյունահանված տեքստը և գրեք այն TXT ֆայլում՝ նշելով ֆայլի ուղին և անունը:
Կոդ՝ PDF-ը Python-ում տեքստի փոխակերպելու համար
import aspose.pdf as pdf | |
# Load the license | |
license = pdf.License() | |
license.set_license("Aspose.Total.lic") | |
# Load input PDF document | |
document = pdf.Document("Combine.pdf") | |
# Initialize TextAbsorber object | |
textAbsorber = pdf.text.TextAbsorber() | |
# Call Page.Accept() method to fetch text | |
document.pages.accept(textAbsorber) | |
# Get the extracted text string | |
text = textAbsorber.text | |
# Create a TXT file and write the string | |
text_file = open("PDFtoTXT.txt", "wt") | |
n = text_file.write(text) | |
text_file.close() | |
print("Conversion Completed Successfully") |
Այս կոդի հատվածը ցույց է տալիս, թե ինչպես ստեղծել PDF դեպի տեքստ փոխարկիչ՝ օգտագործելով Python: Այն բեռնում է սկզբնաղբյուր PDF փաստաթուղթը՝ օգտագործելով Document դասը: Այնուհետև, դուք կարող եք ստանալ տեքստ PDF ֆայլի բոլոր էջերից ընդունելի մեթոդով կամ կարդալ տեքստային տողը կոնկրետ էջից՝ նշելով էջի համարը: Ի վերջո, գրեք տեքստային տողը ֆայլի մեջ և արտահանեք տեքստային ֆայլը սկավառակ:
Այս հոդվածում մենք սովորեցինք, թե ինչպես կարելի է օգտագործել Python PDF to Text մատուցումը ձեր հավելվածներով: Այնուամենայնիվ, եթե ցանկանում եք սովորել PDF-ի Word-ի փոխարկումը, ապա կարդացեք ձեռնարկը ինչպես փոխարկել PDF-ը Word-ի՝ օգտագործելով Python-ը-ում: