Как конвертировать PDF в Word на Java

Это краткое руководство предназначено для того, чтобы помочь вам преобразовать PDF в Word на Java, загрузив исходный файл PDF и сохранив его как файл Word. При написании конвертера PDF в Word на Java вы сможете контролировать чтение исходного PDF-файла. Точно так же можно настроить выходной файл Word DOC, задав его характеристики.

Шаги для преобразования PDF в Word с помощью Java

  1. Настройте проект, добавив Aspose.PDF из репозитория Maven для преобразования PDF в файл Word.
  2. Загрузите исходный файл PDF в объект класса Document для преобразования в файл Word.
  3. Создайте объект класса DocSaveOptions для настройки выходного файла Word.
  4. Определите тип выходного файла Word и режим распознавания, чтобы установить режим редактирования в будущем.
  5. Установите параметры чтения исходного PDF-файла, такие как горизонтальная близость и флаг распознавания маркеров.
  6. Сохраните выходной файл Word, используя указанную конфигурацию в объекте DocSaveOptions.

Приведенные выше шаги описывают процесс разработки конвертера PDF в Word с использованием Java путем определения необходимых библиотек из репозитория Maven и пошаговой последовательности операций. Исходный файл PDF загружается в объект класса Document, и объект класса DocSaveOptions инициализируется для управления операцией чтения из исходного файла PDF и установки параметров выходного файла Word. Выходной файл Word можно сохранить в любом поддерживаемом MS Word формате файла, настроенном в объекте класса DocSaveOptions.

Код для преобразования PDF в Word с использованием Java

package AsposePdf;
import com.aspose.pdf.DocSaveOptions;
import com.aspose.pdf.Document;
import com.aspose.pdf.ExcelSaveOptions;
import com.aspose.pdf.License;
public class ConvertPdfToWordInJava {
public static void main(String[] args) throws Exception { // main method to convert a PDF document to Word file format
// Instantiate the license to avoid trial limitations while converting the PDF to word file
License asposePdfLicenseDoc = new License();
asposePdfLicenseDoc.setLicense("Aspose.pdf.lic");
// Load the source PDF file that is to be converted to Word file
Document convertPDFDocumentToWord = new Document("input.pdf");
// Initialize the DocSaveOptions class object to configure output word file
DocSaveOptions docSaveOptions = new DocSaveOptions();
// Define the type of output Word file
docSaveOptions.setFormat(DocSaveOptions.DocFormat.Doc);
// Set the recognition mode to Flow for enabling it for editing in future
docSaveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);
// Set the Horizontal proximity that defines width of space between text elements as 2.5
docSaveOptions.setRelativeHorizontalProximity(2.5f);
// Switch on the recognition of bullets from the source PDF
docSaveOptions.setRecognizeBullets(true);
// Convert PDF to Word using the Document class function save
convertPDFDocumentToWord.save("output.doc", docSaveOptions);
System.out.println("Done");
}
}

Для преобразования PDF в Word Java-код импортирует необходимые классы, используемые в программе, и загружает исходный PDF-файл с диска. Класс DocSaveOptions поддерживает настройку множества параметров, таких как определение типа выходного файла Word, который может быть DOC или DOCX, установка флага для создания редактируемого выходного файла Word, установка флага для распознавания маркеров, установка горизонтального и вертикального разрешения преобразованного файла. изображения и многое другое.

Здесь мы узнали, как конвертировать PDF в Word на Java с помощью примера кода. Если вы хотите узнать, как преобразовать PDF в Excel, обратитесь к статье как конвертировать PDF в Excel на Java.

 Русский