วิธีแปลง PDF เป็น HTML ใน Java

ในบทแนะนำสั้นๆ นี้ คุณจะได้เรียนรู้วิธี แปลง PDF เป็น HTML ใน Java เราสามารถบันทึก PDF เป็น HTML ในภาษาจาวา ได้ง่ายๆ โดยใช้ขั้นตอนง่ายๆ และเรียกใช้โค้ดใน Windows, macOS หรือ Linux โดยไม่ต้องพึ่งพา Adobe Acrobat หรือเครื่องมือของบุคคลที่สามอื่นๆ

ขั้นตอนในการแปลง PDF เป็น HTML ใน Java

  1. กำหนดค่าโครงการของคุณเพื่อเพิ่มการอ้างอิง Aspose.PDF for Java จากที่เก็บ Maven
  2. เพิ่มการอ้างอิงไปยังเนมสเปซ Aspose.PDF ในโครงการของคุณ
  3. สร้างอินสแตนซ์ Document class วัตถุเพื่อโหลด PDF เพื่อส่งออกเป็น HTML
  4. สร้างวัตถุ HtmlSaveOptions เพื่อตั้งค่าตัวเลือก HTML ต่างๆ
  5. แปลง PDF เป็น HTML ใน Java โดยใช้วิธีบันทึก

เพื่อพัฒนา ตัวแปลง PDF เป็น HTML สามารถใช้แอปพลิเคชันที่ใช้ Java ได้ กระบวนการจะเริ่มต้นโดยรวมการอ้างอิง API และการโหลดไฟล์ PDF ต้นฉบับจากดิสก์ ในขั้นตอนต่อมา คลาส HtmlSaveOptions จะถูกใช้เพื่อตั้งค่าตัวเลือกการส่งออกไฟล์ HTML ที่ต้องการ สุดท้าย HTML ที่สร้างขึ้นจะถูกบันทึกโดยใช้เมธอด Save และ SaveFormat.Html enumerator

รหัสเพื่อบันทึก PDF เป็น HTML ใน Java

import com.aspose.pdf.Document;
import com.aspose.pdf.HtmlSaveOptions;
import com.aspose.pdf.HtmlSaveOptions.FontSavingModes;
import com.aspose.pdf.License;
import com.aspose.pdf.SaveFormat;
public class PdfToHtmlExport {
public static void Main(String[] args) throws Exception{
// Applying product license to create HTML from PDF in Java
License pdfJavaLic = new License();
pdfJavaLic.setLicense("PDF.Product.Family.lic");
// Initialize document object load the source PDF for exporting to HTML
Document document = new Document("Test.pdf");
// Initialize HTML SaveOptions to set export options
HtmlSaveOptions htmlSaveOptions = new HtmlSaveOptions();
// Split multi HTML pages
htmlSaveOptions.setSplitIntoPages(true);
// Set Font saving mode
htmlSaveOptions.FontSavingMode = FontSavingModes.AlwaysSaveAsTTF;
// Managing SVG folders content
htmlSaveOptions.SpecialFolderForSvgImages = "\\SvgSavePath";
// Managing Images folder inside PDF
htmlSaveOptions.SpecialFolderForAllImages = "\\ImageSavePath";
// Using Java PDF to HTML export via Save method
document.save("Generated_out_Java.html",SaveFormat.Html);
}
}

โดยใช้ตัวอย่างข้างต้นในการแปลง Java PDF เป็น HTML สามารถทำได้โดยง่าย เราได้ปรับแต่งเอาต์พุต HTML โดยใช้คลาส HtmlSaveOptions ซึ่งมีข้อกำหนดในการตั้งค่าตัวเลือกการส่งออก SVG เช่น การบีบอัดและเนื้อหา SVG พร้อมกับการตั้งค่าเส้นทางสำหรับรูปภาพที่ส่งออกจาก PDF ต้นทาง คุณยังสามารถจัดการแบบอักษรภายใน HTML ที่ส่งออกพร้อมกับตัวเลือกในการแยกหน้า PDF เป็นเอาต์พุต HTML หลายหน้า สุดท้าย เราสามารถบันทึก HTML ที่สร้างขึ้นบนดิสก์หรือใน MemoryStream เพื่อการใช้งานต่อไป

ในตัวอย่างข้างต้น เราได้เรียนรู้การ แปลง PDF เป็น HTML ใน Java ด้วยเอาต์พุตที่กำหนดเอง หากคุณต้องการสร้าง PDF โดยทางโปรแกรม โปรดดูบทความใน วิธีสร้าง PDF โดยใช้ Java

 ไทย