Hur man konverterar PDF till text i Java

Denna korta handledning ger information om hur man konverterar PDF till text i Java genom att ladda indatadokumentet PDF och spara det i formatet Text. Dessutom kan användningen av Java PDF till textkonverterare anpassas för att kontrollera om du vill ha utdatatexten med eller utan formatering jämfört med PDF-källfilen.

Steg för att konvertera PDF till text i Java

  1. Konfigurera din applikation genom att lägga till referensen till Aspose.PDF från Maven-arkivet för att konvertera PDF till en textfil
  2. Ladda in PDF-filen med klassobjektet Document för konvertering av PDF till en textfil
  3. Skapa ett objekt av klassen TextAbsorber för att ställa in alternativen för textextraktion
  4. Skriv den extraherade texten till en textfil

Ovanstående steg utvecklar processen för att utveckla en PDF till Text Java-baserad omvandlarapplikation. I det första steget laddas det inmatade PDF-dokumentet med hjälp av instansen Document class och välj sedan om du vill ha texten med formatering eller inte. Slutligen kan du använda textsträngen för att skriva in i en fil eller bearbeta den vidare enligt dina krav.

Kod för att konvertera PDF till text i Java

Denna exempelkod visar att genom att använda Java konvertera PDF till text med full kontroll genom att använda olika alternativ som TextAbsorber-klassen har flera konstruktorer där du kan använda TextSearchOptions som ger möjlighet att konvertera den skuggade texten i käll-PDF som en separat text. På samma sätt kan du ställa in flaggor för att endast söka efter text inom sidavgränsningen eller ställa in en rektangel för att söka efter text från ett specifikt område endast på alla sidor.

Här har vi lärt oss hur man konverterar PDF till text i Java tillsammans med kodavsnittet. Om du vill lära dig processen för att konvertera PDF till Word, se artikeln om hur man konverterar PDF till Word i Java.

 Svenska