Як конвертувати PDF у Word на Java

Цей короткий підручник призначений для того, щоб перетворити PDF у Word у Java, завантаживши вихідний файл PDF і зберігши його як файл Word. Під час написання конвертера PDF у Word на Java ви матимете контроль над читанням вихідного файлу PDF. Так само вихідний файл Word DOC також можна налаштувати, встановивши його характеристики.

Кроки для перетворення PDF у Word за допомогою Java

  1. Налаштуйте проект, додавши Aspose.PDF зі сховища Maven, щоб конвертувати PDF у файл Word
  2. Завантажте вихідний файл PDF в об’єкт класу Document для перетворення у файл Word
  3. Створіть екземпляр об’єкта класу DocSaveOptions, щоб налаштувати вихідний файл Word
  4. Визначте тип вихідного файлу Word і режим розпізнавання, щоб налаштувати майбутній режим редагування
  5. Встановіть параметри читання вихідного PDF-файлу, як-от горизонтальну близькість і позначку розпізнавання маркерів
  6. Збережіть вихідний файл Word, використовуючи вказану конфігурацію в об’єкті DocSaveOptions

Наведені вище кроки описують процес розробки конвертера PDF у Word за допомогою Java шляхом визначення необхідних бібліотек зі сховища Maven і послідовності операцій крок за кроком. Вихідний PDF-файл завантажується в об’єкт класу Document, а об’єкт класу DocSaveOptions ініціалізується для керування операцією читання з вихідного PDF-файлу та встановлення параметрів вихідного файлу Word. Вихідний файл Word можна зберегти в будь-якому форматі файлу, який підтримує MS Word, як налаштовано в об’єкті класу DocSaveOptions.

Код для перетворення PDF у Word за допомогою Java

package AsposePdf;
import com.aspose.pdf.DocSaveOptions;
import com.aspose.pdf.Document;
import com.aspose.pdf.ExcelSaveOptions;
import com.aspose.pdf.License;
public class ConvertPdfToWordInJava {
public static void main(String[] args) throws Exception { // main method to convert a PDF document to Word file format
// Instantiate the license to avoid trial limitations while converting the PDF to word file
License asposePdfLicenseDoc = new License();
asposePdfLicenseDoc.setLicense("Aspose.pdf.lic");
// Load the source PDF file that is to be converted to Word file
Document convertPDFDocumentToWord = new Document("input.pdf");
// Initialize the DocSaveOptions class object to configure output word file
DocSaveOptions docSaveOptions = new DocSaveOptions();
// Define the type of output Word file
docSaveOptions.setFormat(DocSaveOptions.DocFormat.Doc);
// Set the recognition mode to Flow for enabling it for editing in future
docSaveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);
// Set the Horizontal proximity that defines width of space between text elements as 2.5
docSaveOptions.setRelativeHorizontalProximity(2.5f);
// Switch on the recognition of bullets from the source PDF
docSaveOptions.setRecognizeBullets(true);
// Convert PDF to Word using the Document class function save
convertPDFDocumentToWord.save("output.doc", docSaveOptions);
System.out.println("Done");
}
}

Щоб перетворити PDF на код Java, імпортує необхідні класи, які використовуються в програмі, і завантажує вихідний PDF-файл із диска. Клас DocSaveOptions підтримує встановлення багатьох параметрів, як-от визначення типу вихідного файлу Word, який може бути DOC або DOCX, встановлення прапора для створення редагованого вихідного файлу Word, встановлення прапора для розпізнавання маркерів, встановлення горизонтальної та вертикальної роздільної здатності перетвореного зображення та багато іншого.

Тут ми дізналися, як конвертувати PDF у Word на Java за допомогою зразка коду. Якщо ви хочете дізнатися, як конвертувати PDF у Excel, перегляньте статтю як конвертувати PDF в Excel на Java.

 Українська