Αυτό το σύντομο σεμινάριο έχει σχεδιαστεί για να καθοδηγήσει σχετικά με τον τρόπο μετατροπής PDF σε Word σε Java φορτώνοντας το αρχείο προέλευσης PDF και αποθηκεύοντάς το ως αρχείο Word. Κατά τη σύνταξη μετατροπέα PDF σε Word σε Java, θα έχετε τον έλεγχο της ανάγνωσης του αρχείου προέλευσης PDF. Ομοίως, το αρχείο εξόδου Word DOC μπορεί επίσης να προσαρμοστεί ορίζοντας τα χαρακτηριστικά του.
Βήματα για τη μετατροπή PDF σε Word χρησιμοποιώντας Java
- Διαμορφώστε το έργο προσθέτοντας Aspose.PDF από το αποθετήριο Maven για μετατροπή PDF σε αρχείο Word
- Φορτώστε το αρχείο προέλευσης PDF στο αντικείμενο κλάσης Document για μετατροπή σε αρχείο Word
- Δημιουργήστε το αντικείμενο κλάσης DocSaveOptions για να διαμορφώσετε το αρχείο εξόδου του Word
- Καθορίστε τον τύπο αρχείου εξόδου του Word και τη λειτουργία αναγνώρισης για να ορίσετε τη μελλοντική λειτουργία επεξεργασίας
- Ορίστε τις παραμέτρους ανάγνωσης του αρχείου PDF πηγής, όπως η σημαία οριζόντιας εγγύτητας και αναγνώρισης κουκκίδων
- Αποθηκεύστε το αρχείο εξόδου Word χρησιμοποιώντας την καθορισμένη διαμόρφωση στο αντικείμενο DocSaveOptions
Τα παραπάνω βήματα περιγράφουν τη διαδικασία σχεδιασμού ενός μετατροπέα PDF σε Word χρησιμοποιώντας Java, προσδιορίζοντας τις απαιτούμενες βιβλιοθήκες από το αποθετήριο Maven και μια ακολουθία λειτουργιών βήμα προς βήμα. Το αρχείο προέλευσης PDF φορτώνεται στο αντικείμενο κλάσης Document και ένα αντικείμενο κλάσης DocSaveOptions προετοιμάζεται για τον έλεγχο της λειτουργίας ανάγνωσης από το αρχείο PDF προέλευσης και τη ρύθμιση των παραμέτρων του αρχείου εξόδου του Word. Το αρχείο εξόδου Word μπορεί να αποθηκευτεί σε οποιαδήποτε μορφή αρχείου που υποστηρίζεται από το MS Word, όπως έχει διαμορφωθεί στο αντικείμενο κλάσης DocSaveOptions.
Κώδικας για μετατροπή PDF σε Word χρησιμοποιώντας Java
package AsposePdf; | |
import com.aspose.pdf.DocSaveOptions; | |
import com.aspose.pdf.Document; | |
import com.aspose.pdf.ExcelSaveOptions; | |
import com.aspose.pdf.License; | |
public class ConvertPdfToWordInJava { | |
public static void main(String[] args) throws Exception { // main method to convert a PDF document to Word file format | |
// Instantiate the license to avoid trial limitations while converting the PDF to word file | |
License asposePdfLicenseDoc = new License(); | |
asposePdfLicenseDoc.setLicense("Aspose.pdf.lic"); | |
// Load the source PDF file that is to be converted to Word file | |
Document convertPDFDocumentToWord = new Document("input.pdf"); | |
// Initialize the DocSaveOptions class object to configure output word file | |
DocSaveOptions docSaveOptions = new DocSaveOptions(); | |
// Define the type of output Word file | |
docSaveOptions.setFormat(DocSaveOptions.DocFormat.Doc); | |
// Set the recognition mode to Flow for enabling it for editing in future | |
docSaveOptions.setMode(DocSaveOptions.RecognitionMode.Flow); | |
// Set the Horizontal proximity that defines width of space between text elements as 2.5 | |
docSaveOptions.setRelativeHorizontalProximity(2.5f); | |
// Switch on the recognition of bullets from the source PDF | |
docSaveOptions.setRecognizeBullets(true); | |
// Convert PDF to Word using the Document class function save | |
convertPDFDocumentToWord.save("output.doc", docSaveOptions); | |
System.out.println("Done"); | |
} | |
} |
Για μετατροπή PDF σε κώδικα Java του Word εισάγει τις απαραίτητες κλάσεις που χρησιμοποιούνται στο πρόγραμμα και φορτώνει το αρχείο προέλευσης PDF από το δίσκο. Η κλάση DocSaveOptions υποστηρίζει τον καθορισμό πολλών παραμέτρων, όπως τον καθορισμό του τύπου αρχείου εξόδου του Word που μπορεί να είναι είτε DOC είτε DOCX, ορισμός της σημαίας για τη δημιουργία επεξεργάσιμου αρχείου εξόδου Word, ρύθμιση της σημαίας για αναγνώριση κουκκίδων, ορισμός της οριζόντιας και κάθετης ανάλυσης του μετατραπέντος εικόνες και πολλά άλλα.
Εδώ μάθαμε πώς να μετατρέπουμε PDF σε Word σε Java με τη βοήθεια ενός δείγματος κώδικα. Εάν θέλετε να μάθετε τη διαδικασία μετατροπής PDF σε Excel, ανατρέξτε στο άρθρο στο πώς να μετατρέψετε PDF σε Excel σε Java.