Denna snabba handledning förklarar hur man konverterar PDF till Text med Python. Den täcker systemkonfigurationsdetaljer och stegvis process tillsammans med en exempelkod för att utföra PDF till Text Python-baserad konvertering. Dessutom kan du skriva den extraherade texten till filen eller på konsolen enligt dina krav.
Steg för att konvertera PDF till text i Python
- Konfigurera systemet genom att installera Aspose.PDF för Python via .NET-biblioteket
- Ladda käll-PDF-filen med klassen Document för att konvertera den till en textfil
- Skapa ett TextAbsorber klassobjekt för att hämta text med metoden Page.Accept()
- Skapa en textfil och skriv den utgående textsträngen i filen
Dessa steg sammanfattar hur användning av Python PDF till TXT-konvertering kan utföras med ett par API-anrop. I det första steget laddar du in PDF-filen och initierar ett objekt av TextAbsorber som kan användas för att hämta text från sidorna. Sedan måste du hämta den extraherade texten och skriva den till en TXT-fil samtidigt som du anger sökvägen och namnet på filen.
Kod för att konvertera PDF till text i Python
Detta kodavsnitt visar hur man skapar en PDF till text-omvandlare med Python. Den laddar käll-PDF-dokumentet med klassen Document. Därefter kan du hämta text från alla sidor i PDF-filen med acceptmetoden eller läsa textsträngen från en specifik sida genom att ange sidnumret. Skriv slutligen textsträngen till en fil och exportera textfilen till disken.
I den här artikeln har vi lärt oss hur man kan använda Python PDF to Text-rendering med dina applikationer. Men om du vill lära dig konvertera PDF till Word, läs handledningen på hur man konverterar PDF till Word med Python.