บทแนะนำสั้นนี้แนะนำวิธี แปลง PDF ที่สแกนเป็น PDF ที่แก้ไขได้โดยใช้ Java. มีรายละเอียดสำหรับการกำหนดค่า IDE รายการขั้นตอน และโค้ดตัวอย่างเพื่อ แปลง PDF ที่สแกนเป็น PDF ที่ค้นหาได้โดยใช้ Java. คุณจะได้รับรายละเอียดเพื่อปรับแต่งกระบวนการสแกนภาพและแปลงเนื้อหาเป็นข้อความที่อ่านได้.
ขั้นตอนในการทำให้ PDF อ่านได้โดยใช้ Java
- ตั้งค่า IDE ให้ใช้ Aspose.Total for Java เพื่อแปลง PDF ที่สแกนเป็น PDF ที่สามารถค้นหาได้
- สร้างอินสแตนซ์ใบอนุญาตผลิตภัณฑ์ที่เกี่ยวข้องเพื่อหลีกเลี่ยงลายน้ำในผลลัพธ์
- สร้างอินสแตนซ์ของเอนจินการจดจำโดยใช้คลาส AsposeOCR
- สร้างอินสแตนซ์อินพุตโดยใช้คลาส OcrInput และโหลดไฟล์ PDF สแกนต้นฉบับเข้าไปในนั้น
- สร้างอินสแตนซ์ RecognitionSettings เพื่อกำหนดพารามิเตอร์สำหรับการปรับแต่งระหว่างการสแกนภาพ
- เรียกใช้เมธอด AsposeOCR.Recognize() เพื่อดึงข้อมูลจาก PDF ที่สแกนและเก็บไว้ใน PDF ชั่วคราว
- โหลดไฟล์ PDF ระหว่างขั้นตอนเข้าสู่วัตถุคลาส Document ของ Aspose.PDF และตั้งค่าเมตาดาต้าในนั้น
- บันทึก PDF สุดท้ายลงดิสก์พร้อมข้อความที่สามารถค้นหาได้และเมตาดาต้า
ขั้นตอนเหล่านี้อธิบายวิธีแปลง PDF image to PDF text using Java สร้างอ็อบเจกต์เอนจินการจดจำ, เตรียมไฟล์อินพุตโดยเพิ่มไฟล์ PDF ที่สแกนเข้าไปในอ็อบเจกต์ OcrInput, กำหนดพารามิเตอร์ในอ็อบเจกต์ RecognitionSettings, เรียกเมธอด Recognize() เพื่อสแกนข้อมูลและบันทึกผลลัพธ์ในไฟล์ PDF ชั่วคราว. สุดท้ายโหลดไฟล์ PDF ชั่วคราวโดยใช้อ็อบเจกต์ Aspose.PDF.Document และเพิ่มเมตาดาต้าหรือจัดรูปแบบเพิ่มเติมก่อนบันทึกไฟล์ PDF สุดท้าย.
โค้ดสำหรับแปลงรูปภาพ PDF เป็นข้อความโดยใช้ Java
โค้ดนี้แสดงวิธี แปลง PDF เป็น PDF ที่สามารถค้นหาได้โดยใช้ Java. คุณสามารถตั้งค่าภาษาในการตรวจจับเฉพาะขณะสแกน PDF, ตั้งค่าสถานะเพื่อให้ตรวจจับภาษาอัตโนมัติ, จำกัดการจดจำให้เฉพาะอักขระที่ต้องการหรือบล็อกอักขระที่คุณต้องการให้ OCR เพิกเฉย. ตัวเลือกยังมีให้เลือกกลยุทธ์การตรวจจับพื้นที่/การจัดวางของเอกสารต้นฉบับหากต้องการ.
บทความนี้ได้สอนกระบวนการแปลง PDF ให้เป็น PDF ที่เลือกข้อความได้ หากต้องการส่งออกข้อมูลจากแบบฟอร์ม PDF ไปยัง Excel ให้ดูบทความ ส่งออกข้อมูลจากแบบฟอร์ม PDF ไปยัง Excel ด้วย Java