ในบทแนะนำสั้นๆ นี้ คุณจะได้เรียนรู้วิธี แปลง PDF เป็น HTML ใน Java เราสามารถบันทึก PDF เป็น HTML ในภาษาจาวา ได้ง่ายๆ โดยใช้ขั้นตอนง่ายๆ และเรียกใช้โค้ดใน Windows, macOS หรือ Linux โดยไม่ต้องพึ่งพา Adobe Acrobat หรือเครื่องมือของบุคคลที่สามอื่นๆ
ขั้นตอนในการแปลง PDF เป็น HTML ใน Java
- กำหนดค่าโครงการของคุณเพื่อเพิ่มการอ้างอิง Aspose.PDF for Java จากที่เก็บ Maven
- เพิ่มการอ้างอิงไปยังเนมสเปซ Aspose.PDF ในโครงการของคุณ
- สร้างอินสแตนซ์ Document class วัตถุเพื่อโหลด PDF เพื่อส่งออกเป็น HTML
- สร้างวัตถุ HtmlSaveOptions เพื่อตั้งค่าตัวเลือก HTML ต่างๆ
- แปลง PDF เป็น HTML ใน Java โดยใช้วิธีบันทึก
เพื่อพัฒนา ตัวแปลง PDF เป็น HTML สามารถใช้แอปพลิเคชันที่ใช้ Java ได้ กระบวนการจะเริ่มต้นโดยรวมการอ้างอิง API และการโหลดไฟล์ PDF ต้นฉบับจากดิสก์ ในขั้นตอนต่อมา คลาส HtmlSaveOptions จะถูกใช้เพื่อตั้งค่าตัวเลือกการส่งออกไฟล์ HTML ที่ต้องการ สุดท้าย HTML ที่สร้างขึ้นจะถูกบันทึกโดยใช้เมธอด Save และ SaveFormat.Html enumerator
รหัสเพื่อบันทึก PDF เป็น HTML ใน Java
import com.aspose.pdf.Document; | |
import com.aspose.pdf.HtmlSaveOptions; | |
import com.aspose.pdf.HtmlSaveOptions.FontSavingModes; | |
import com.aspose.pdf.License; | |
import com.aspose.pdf.SaveFormat; | |
public class PdfToHtmlExport { | |
public static void Main(String[] args) throws Exception{ | |
// Applying product license to create HTML from PDF in Java | |
License pdfJavaLic = new License(); | |
pdfJavaLic.setLicense("PDF.Product.Family.lic"); | |
// Initialize document object load the source PDF for exporting to HTML | |
Document document = new Document("Test.pdf"); | |
// Initialize HTML SaveOptions to set export options | |
HtmlSaveOptions htmlSaveOptions = new HtmlSaveOptions(); | |
// Split multi HTML pages | |
htmlSaveOptions.setSplitIntoPages(true); | |
// Set Font saving mode | |
htmlSaveOptions.FontSavingMode = FontSavingModes.AlwaysSaveAsTTF; | |
// Managing SVG folders content | |
htmlSaveOptions.SpecialFolderForSvgImages = "\\SvgSavePath"; | |
// Managing Images folder inside PDF | |
htmlSaveOptions.SpecialFolderForAllImages = "\\ImageSavePath"; | |
// Using Java PDF to HTML export via Save method | |
document.save("Generated_out_Java.html",SaveFormat.Html); | |
} | |
} |
โดยใช้ตัวอย่างข้างต้นในการแปลง Java PDF เป็น HTML สามารถทำได้โดยง่าย เราได้ปรับแต่งเอาต์พุต HTML โดยใช้คลาส HtmlSaveOptions ซึ่งมีข้อกำหนดในการตั้งค่าตัวเลือกการส่งออก SVG เช่น การบีบอัดและเนื้อหา SVG พร้อมกับการตั้งค่าเส้นทางสำหรับรูปภาพที่ส่งออกจาก PDF ต้นทาง คุณยังสามารถจัดการแบบอักษรภายใน HTML ที่ส่งออกพร้อมกับตัวเลือกในการแยกหน้า PDF เป็นเอาต์พุต HTML หลายหน้า สุดท้าย เราสามารถบันทึก HTML ที่สร้างขึ้นบนดิสก์หรือใน MemoryStream เพื่อการใช้งานต่อไป
ในตัวอย่างข้างต้น เราได้เรียนรู้การ แปลง PDF เป็น HTML ใน Java ด้วยเอาต์พุตที่กำหนดเอง หากคุณต้องการสร้าง PDF โดยทางโปรแกรม โปรดดูบทความใน วิธีสร้าง PDF โดยใช้ Java