Dieses kurze Tutorial soll Ihnen zeigen, wie Sie PDF in Word in Java konvertieren, indem Sie die Quelldatei PDF laden und als Word-Datei speichern. Während Sie PDF to Word Converter in Java schreiben, haben Sie die Kontrolle über das Lesen der PDF-Quelldatei. In ähnlicher Weise kann auch die ausgegebene Word-DOC-Datei angepasst werden, indem ihre Eigenschaften festgelegt werden.
Schritte zum Konvertieren von PDF in Word mit Java
- Konfigurieren Sie das Projekt, indem Sie Aspose.PDF aus dem Maven-Repository hinzufügen, um PDF in eine Word-Datei zu konvertieren
- Laden Sie die PDF-Quelldatei in das Klassenobjekt Document zur Konvertierung in eine Word-Datei
- Instanziieren Sie das Klassenobjekt DocSaveOptions, um die Word-Ausgabedatei zu konfigurieren
- Definieren Sie den Typ der Word-Ausgabedatei und den Erkennungsmodus, um den zukünftigen Bearbeitungsmodus festzulegen
- Legen Sie die Parameter zum Lesen der PDF-Quelldatei wie horizontale Nähe und Aufzählungszeichen fest
- Speichern Sie die Word-Ausgabedatei mit der angegebenen Konfiguration im DocSaveOptions-Objekt
Die obigen Schritte beschreiben den Prozess zum Entwerfen eines PDF-in-Word-Konverters mit Java, indem die erforderlichen Bibliotheken aus dem Maven-Repository und eine Schritt-für-Schritt-Operationssequenz identifiziert werden. Die Quell-PDF-Datei wird in das Document-Klassenobjekt geladen und ein DocSaveOptions-Klassenobjekt wird initialisiert, um den Lesevorgang aus der Quell-PDF-Datei zu steuern und die Parameter der Ausgabe-Word-Datei einzustellen. Die Word-Ausgabedatei kann in jedem von MS Word unterstützten Dateiformat gespeichert werden, wie im Klassenobjekt DocSaveOptions konfiguriert.
Code zum Konvertieren von PDF in Word mit Java
package AsposePdf; | |
import com.aspose.pdf.DocSaveOptions; | |
import com.aspose.pdf.Document; | |
import com.aspose.pdf.ExcelSaveOptions; | |
import com.aspose.pdf.License; | |
public class ConvertPdfToWordInJava { | |
public static void main(String[] args) throws Exception { // main method to convert a PDF document to Word file format | |
// Instantiate the license to avoid trial limitations while converting the PDF to word file | |
License asposePdfLicenseDoc = new License(); | |
asposePdfLicenseDoc.setLicense("Aspose.pdf.lic"); | |
// Load the source PDF file that is to be converted to Word file | |
Document convertPDFDocumentToWord = new Document("input.pdf"); | |
// Initialize the DocSaveOptions class object to configure output word file | |
DocSaveOptions docSaveOptions = new DocSaveOptions(); | |
// Define the type of output Word file | |
docSaveOptions.setFormat(DocSaveOptions.DocFormat.Doc); | |
// Set the recognition mode to Flow for enabling it for editing in future | |
docSaveOptions.setMode(DocSaveOptions.RecognitionMode.Flow); | |
// Set the Horizontal proximity that defines width of space between text elements as 2.5 | |
docSaveOptions.setRelativeHorizontalProximity(2.5f); | |
// Switch on the recognition of bullets from the source PDF | |
docSaveOptions.setRecognizeBullets(true); | |
// Convert PDF to Word using the Document class function save | |
convertPDFDocumentToWord.save("output.doc", docSaveOptions); | |
System.out.println("Done"); | |
} | |
} |
Um PDF in Word umzuwandeln, importiert Java-Code die erforderlichen Klassen, die im Programm verwendet werden, und lädt die PDF-Quelldatei von der Festplatte. Die DocSaveOptions-Klasse unterstützt das Festlegen vieler Parameter, z. B. das Definieren des Word-Ausgabedateityps, der entweder DOC oder DOCX sein kann, das Festlegen des Flags zum Erstellen einer bearbeitbaren Word-Ausgabedatei, das Festlegen des Flags zum Erkennen von Aufzählungszeichen, das Festlegen der horizontalen und vertikalen Auflösung der konvertierten Datei Bilder und vieles mehr.
Hier haben wir anhand eines Beispielcodes gelernt, wie man PDF in Word in Java konvertiert. Wenn Sie mehr über den Vorgang zum Konvertieren von PDF in Excel erfahren möchten, lesen Sie den Artikel zu wie man PDF in Excel in Java konvertiert.