ในหัวข้อง่ายๆ นี้ คุณจะได้เรียนรู้วิธี แปลง Word Document เป็น HTML โดยใช้ Java ขั้นตอนง่ายๆ ต่อไปนี้สามารถใช้เพื่อส่งออก DOCX เป็น HTML ใน Java ในระบบปฏิบัติการทั่วไปใดๆ เช่น MS Windows, Ubuntu หรือ macOS โดยใช้การเรียก API อย่างง่าย
ขั้นตอนในการแปลงเอกสาร Word เป็น HTML โดยใช้ Java
- เพิ่มการอ้างอิงไฟล์ Aspose.Words JAR โดยใช้ที่เก็บ Maven
- ยกตัวอย่างวัตถุ Document Class เพื่อโหลดเอกสารต้นฉบับ
- ระบุ HtmlSaveOptions ต่างๆ รวมถึง Page Margins, CssStyleSheet และ Page Setup เป็นต้น
- ส่งออก DOCX เป็น HTML ใน Java โดยใช้วิธีบันทึก
ในโค้ดตัวอย่างต่อไปนี้ ก่อนอื่นเราจะโหลด DOCX ต้นทางโดยใช้อินสแตนซ์ Document class จากนั้นใช้อินสแตนซ์ HtmlSaveOptions class เราจะตั้งค่า CssStyleSheetType, ExportPageMargins และ ImageResolution สุดท้าย ใช้วิธีบันทึก เราจะ สร้าง HTML จาก DOCX ใน Java
รหัสเพื่อส่งออก DOCX เป็น HTML ใน Java
ในโค้ดตัวอย่างนี้ เราได้โหลด DOCX ต้นทางโดยใช้อินสแตนซ์ของ Document class อินสแตนซ์ HtmlSaveOptions class สามารถใช้เพื่อตั้งค่าตัวเลือกต่างๆ เช่น การเข้ารหัส ตัวเลือก SVG เวอร์ชัน และคุณสมบัติอื่นๆ อีกมากมาย สุดท้าย เรา ส่งออก DOCX เป็น HTML โดยใช้ Java
ในหัวข้อก่อนหน้าของ วิธีแปลง DOCX เป็น TIFF โดยใช้ Java เรามุ่งเน้นไปที่การเรนเดอร์ DOCX เป็น TIFF ในหัวข้อนี้ เราได้เรียนรู้วิธีการ สร้าง HTML จาก DOCX โดยใช้ Java