Как да конвертирате PDF в Word в Java

Този кратък урок е предназначен да напътства как да конвертирате PDF в Word в Java, като заредите изходния файл PDF и го запазите като файл на Word. Докато пишете конвертор на PDF към Word в Java, ще имате контрол върху четенето на изходния PDF файл. По същия начин изходният Word DOC файл също може да бъде персонализиран чрез задаване на неговите характеристики.

Стъпки за конвертиране на PDF в Word с помощта на Java

  1. Конфигурирайте проекта, като добавите Aspose.PDF от хранилището на Maven, за да конвертирате PDF в Word файл
  2. Заредете изходния PDF файл в обекта на клас Document за преобразуване във файл на Word
  3. Създайте екземпляр на обекта от клас DocSaveOptions, за да конфигурирате изходния файл на Word
  4. Определете типа на изходния Word файл и режима на разпознаване, за да зададете бъдещ режим на редактиране
  5. Задайте параметри за четене на изходния PDF файл като хоризонтална близост и флаг за разпознаване на куршуми
  6. Запишете изходния файл на Word, като използвате указаната конфигурация в обекта DocSaveOptions

Горните стъпки описват процеса на проектиране на конвертор PDF към Word с помощта на Java чрез идентифициране на необходимите библиотеки от хранилището на Maven и последователност от операции стъпка по стъпка. Изходният PDF файл се зарежда в обекта на клас Document и се инициализира обект на клас DocSaveOptions за контролиране на операцията по четене от изходния PDF файл и задаване на параметрите на изходния Word файл. Изходният Word файл може да бъде записан във всеки поддържан от MS Word файлов формат, както е конфигуриран в обекта на класа DocSaveOptions.

Код за конвертиране на PDF в Word с помощта на Java

package AsposePdf;
import com.aspose.pdf.DocSaveOptions;
import com.aspose.pdf.Document;
import com.aspose.pdf.ExcelSaveOptions;
import com.aspose.pdf.License;
public class ConvertPdfToWordInJava {
public static void main(String[] args) throws Exception { // main method to convert a PDF document to Word file format
// Instantiate the license to avoid trial limitations while converting the PDF to word file
License asposePdfLicenseDoc = new License();
asposePdfLicenseDoc.setLicense("Aspose.pdf.lic");
// Load the source PDF file that is to be converted to Word file
Document convertPDFDocumentToWord = new Document("input.pdf");
// Initialize the DocSaveOptions class object to configure output word file
DocSaveOptions docSaveOptions = new DocSaveOptions();
// Define the type of output Word file
docSaveOptions.setFormat(DocSaveOptions.DocFormat.Doc);
// Set the recognition mode to Flow for enabling it for editing in future
docSaveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);
// Set the Horizontal proximity that defines width of space between text elements as 2.5
docSaveOptions.setRelativeHorizontalProximity(2.5f);
// Switch on the recognition of bullets from the source PDF
docSaveOptions.setRecognizeBullets(true);
// Convert PDF to Word using the Document class function save
convertPDFDocumentToWord.save("output.doc", docSaveOptions);
System.out.println("Done");
}
}

За конвертиране на PDF в Word Java код импортира необходимите класове, използвани в програмата, и зарежда изходния PDF файл от диска. Класът DocSaveOptions поддържа задаване на много параметри като дефиниране на типа на изходния Word файл, който може да бъде DOC или DOCX, задаване на флага за създаване на редактируем изходен Word файл, задаване на флага за разпознаване на куршуми, задаване на хоризонтална и вертикална разделителна способност на конвертирания изображения и много други.

Тук научихме как да конвертираме PDF в Word в Java с помощта на примерен код. Ако искате да научите процеса на конвертиране на PDF в Excel, вижте статията на как да конвертирате PDF в Excel в Java.

 Български