Ինչպես PDF-ը վերածել տեքստի Python-ի միջոցով

Այս արագ ձեռնարկը բացատրում է ինչպես փոխարկել PDFText-ի` օգտագործելով Python: Այն ընդգրկում է համակարգի կազմաձևման մանրամասները և քայլ առ քայլ գործընթացը, օրինակելի կոդի հետ միասին՝ PDF-ից տեքստ Python-ի վրա հիմնված փոխակերպումը կատարելու համար: Ավելին, դուք կարող եք արդյունահանված տեքստը գրել ֆայլում կամ վահանակում՝ ըստ ձեր պահանջների:

Python-ում PDF-ը տեքստի փոխարկելու քայլեր

  1. Կարգավորեք համակարգը՝ տեղադրելով Aspose.PDF Python-ի համար .NET-ի միջոցով գրադարանը
  2. Բեռնեք սկզբնաղբյուր PDF ֆայլը՝ օգտագործելով Document դասը՝ այն Տեքստային ֆայլի փոխարկելու համար
  3. Ստեղծեք TextAbsorber դասի օբյեկտ՝ Page.Accept() մեթոդով տեքստ ստանալու համար
  4. Ստեղծեք տեքստային ֆայլ և գրեք ելքային տեքստային տողը ֆայլում

Այս քայլերն ամփոփում են, թե ինչպես կարելի է օգտագործել Python PDF-ը TXT փոխակերպումը API-ի մի քանի զանգերի միջոցով: Առաջին քայլում բեռնեք մուտքագրված PDF ֆայլը և սկզբնավորեք TextAbsorber-ի օբյեկտը, որը կարող է օգտագործվել էջերից տեքստ բերելու համար: Այնուհետև դուք պետք է ստանաք արդյունահանված տեքստը և գրեք այն TXT ֆայլում՝ նշելով ֆայլի ուղին և անունը:

Կոդ՝ PDF-ը Python-ում տեքստի փոխակերպելու համար

import aspose.pdf as pdf
# Load the license
license = pdf.License()
license.set_license("Aspose.Total.lic")
# Load input PDF document
document = pdf.Document("Combine.pdf")
# Initialize TextAbsorber object
textAbsorber = pdf.text.TextAbsorber()
# Call Page.Accept() method to fetch text
document.pages.accept(textAbsorber)
# Get the extracted text string
text = textAbsorber.text
# Create a TXT file and write the string
text_file = open("PDFtoTXT.txt", "wt")
n = text_file.write(text)
text_file.close()
print("Conversion Completed Successfully")

Այս կոդի հատվածը ցույց է տալիս, թե ինչպես ստեղծել PDF դեպի տեքստ փոխարկիչ՝ օգտագործելով Python: Այն բեռնում է սկզբնաղբյուր PDF փաստաթուղթը՝ օգտագործելով Document դասը: Այնուհետև, դուք կարող եք ստանալ տեքստ PDF ֆայլի բոլոր էջերից ընդունելի մեթոդով կամ կարդալ տեքստային տողը կոնկրետ էջից՝ նշելով էջի համարը: Ի վերջո, գրեք տեքստային տողը ֆայլի մեջ և արտահանեք տեքստային ֆայլը սկավառակ:

Այս հոդվածում մենք սովորեցինք, թե ինչպես կարելի է օգտագործել Python PDF to Text մատուցումը ձեր հավելվածներով: Այնուամենայնիվ, եթե ցանկանում եք սովորել PDF-ի Word-ի փոխարկումը, ապա կարդացեք ձեռնարկը ինչպես փոխարկել PDF-ը Word-ի՝ օգտագործելով Python-ը-ում:

 Հայերեն