Jak převést PDF do Wordu v Javě

Tento stručný návod je navržen tak, aby vás provedl převodem PDF do Wordu v Javě načtením zdrojového PDF souboru a jeho uložením jako soubor Word. Při psaní převaděče PDF do Wordu v Javě budete mít kontrolu nad čtením zdrojového souboru PDF. Podobně lze upravit výstupní soubor Wordu DOC nastavením jeho charakteristik.

Kroky k převodu PDF do Wordu pomocí Java

  1. Nakonfigurujte projekt přidáním Aspose.PDF z úložiště Maven pro převod PDF do souboru Word
  2. Načtěte zdrojový soubor PDF do objektu třídy Document pro převod na soubor aplikace Word
  3. Vytvořte instanci objektu třídy DocSaveOptions pro konfiguraci výstupního souboru aplikace Word
  4. Definujte typ výstupního souboru Word a režim rozpoznávání pro nastavení budoucího režimu úprav
  5. Nastavte parametry čtení zdrojového souboru PDF, jako je horizontální blízkost a příznak rozpoznání odrážek
  6. Uložte výstupní soubor Word pomocí zadané konfigurace v objektu DocSaveOptions

Výše uvedené kroky popisují proces návrhu PDF do Word konvertoru pomocí Java identifikací požadovaných knihoven z úložiště Maven a sledem operací krok za krokem. Zdrojový soubor PDF se načte do objektu třídy Document a inicializuje se objekt třídy DocSaveOptions pro řízení operace čtení ze zdrojového souboru PDF a nastavení parametrů výstupního souboru Word. Výstupní soubor aplikace Word lze uložit do libovolného formátu souboru podporovaného aplikací MS Word, jak je nakonfigurováno v objektu třídy DocSaveOptions.

Kód pro převod PDF do Wordu pomocí Javy

package AsposePdf;
import com.aspose.pdf.DocSaveOptions;
import com.aspose.pdf.Document;
import com.aspose.pdf.ExcelSaveOptions;
import com.aspose.pdf.License;
public class ConvertPdfToWordInJava {
public static void main(String[] args) throws Exception { // main method to convert a PDF document to Word file format
// Instantiate the license to avoid trial limitations while converting the PDF to word file
License asposePdfLicenseDoc = new License();
asposePdfLicenseDoc.setLicense("Aspose.pdf.lic");
// Load the source PDF file that is to be converted to Word file
Document convertPDFDocumentToWord = new Document("input.pdf");
// Initialize the DocSaveOptions class object to configure output word file
DocSaveOptions docSaveOptions = new DocSaveOptions();
// Define the type of output Word file
docSaveOptions.setFormat(DocSaveOptions.DocFormat.Doc);
// Set the recognition mode to Flow for enabling it for editing in future
docSaveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);
// Set the Horizontal proximity that defines width of space between text elements as 2.5
docSaveOptions.setRelativeHorizontalProximity(2.5f);
// Switch on the recognition of bullets from the source PDF
docSaveOptions.setRecognizeBullets(true);
// Convert PDF to Word using the Document class function save
convertPDFDocumentToWord.save("output.doc", docSaveOptions);
System.out.println("Done");
}
}

Pro převod PDF do Wordu Java kód importuje potřebné třídy používané v programu a načte zdrojový soubor PDF z disku. Třída DocSaveOptions podporuje nastavení mnoha parametrů, jako je definování výstupního typu souboru Word, který může být DOC nebo DOCX, nastavení příznaku pro vytvoření upravitelného výstupního souboru Word, nastavení příznaku pro rozpoznávání odrážek, nastavení horizontálního a vertikálního rozlišení převedeného souboru. obrázky a mnoho dalších.

Zde jsme se naučili, jak převést PDF do Wordu v Javě pomocí ukázkového kódu. Pokud se chcete naučit proces převodu PDF do Excelu, přečtěte si článek na jak převést PDF do Excelu v Javě.

 Čeština