Denna snabba handledning förklarar hur man konverterar PDF till Text med Python. Den täcker systemkonfigurationsdetaljer och stegvis process tillsammans med en exempelkod för att utföra PDF till Text Python-baserad konvertering. Dessutom kan du skriva den extraherade texten till filen eller på konsolen enligt dina krav.
Steg för att konvertera PDF till text i Python
- Konfigurera systemet genom att installera Aspose.PDF för Python via .NET-biblioteket
- Ladda käll-PDF-filen med klassen Document för att konvertera den till en textfil
- Skapa ett TextAbsorber klassobjekt för att hämta text med metoden Page.Accept()
- Skapa en textfil och skriv den utgående textsträngen i filen
Dessa steg sammanfattar hur användning av Python PDF till TXT-konvertering kan utföras med ett par API-anrop. I det första steget laddar du in PDF-filen och initierar ett objekt av TextAbsorber som kan användas för att hämta text från sidorna. Sedan måste du hämta den extraherade texten och skriva den till en TXT-fil samtidigt som du anger sökvägen och namnet på filen.
Kod för att konvertera PDF till text i Python
import aspose.pdf as pdf | |
# Load the license | |
license = pdf.License() | |
license.set_license("Aspose.Total.lic") | |
# Load input PDF document | |
document = pdf.Document("Combine.pdf") | |
# Initialize TextAbsorber object | |
textAbsorber = pdf.text.TextAbsorber() | |
# Call Page.Accept() method to fetch text | |
document.pages.accept(textAbsorber) | |
# Get the extracted text string | |
text = textAbsorber.text | |
# Create a TXT file and write the string | |
text_file = open("PDFtoTXT.txt", "wt") | |
n = text_file.write(text) | |
text_file.close() | |
print("Conversion Completed Successfully") |
Detta kodavsnitt visar hur man skapar en PDF till text-omvandlare med Python. Den laddar käll-PDF-dokumentet med klassen Document. Därefter kan du hämta text från alla sidor i PDF-filen med acceptmetoden eller läsa textsträngen från en specifik sida genom att ange sidnumret. Skriv slutligen textsträngen till en fil och exportera textfilen till disken.
I den här artikeln har vi lärt oss hur man kan använda Python PDF to Text-rendering med dina applikationer. Men om du vill lära dig konvertera PDF till Word, läs handledningen på hur man konverterar PDF till Word med Python.