วิธีแยก PDF โดยใช้ Python

บทช่วยสอนฉบับย่อนี้จะแนะนำ วิธีแยก PDF โดยใช้ Python ประกอบด้วยข้อมูลเกี่ยวกับการตั้งค่าสภาพแวดล้อม กระบวนการพื้นฐานทีละขั้นตอนเพื่อแก้ไขแอปพลิเคชัน และโค้ดตัวอย่างที่เรียกใช้ได้ซึ่งแสดงวิธีใช้ Python แยกหน้า PDF และบันทึกแต่ละหน้าเป็นไฟล์ PDF แยกต่างหาก คุณจะได้เรียนรู้วิธีกรองหน้าและแยกเฉพาะหน้าที่ต้องการหรือปรับแต่งไฟล์ PDF ที่ส่งออกตามข้อกำหนด

ขั้นตอนในการแยก PDF โดยใช้ Python

  1. กำหนดค่า IDE เป็น ใช้ Aspose.PDF สำหรับ Python ผ่าน .NET เพื่อแยก PDF
  2. โหลดไฟล์ PDF ต้นฉบับลงในวัตถุ Document ที่มี pages หลายรายการสำหรับแยก
  3. แยกวิเคราะห์ทุกหน้าของไฟล์ PDF ที่โหลด
  4. ในการวนซ้ำแต่ละครั้ง ให้สร้างไฟล์ PDF ใหม่และเพิ่มหน้าการวนซ้ำปัจจุบันเข้าไป
  5. บันทึกไฟล์ PDF ที่เป็นผลลัพธ์ด้วยหน้าเดียวในนั้นด้วยชื่อที่ไม่ซ้ำใคร

ขั้นตอนเหล่านี้สรุปขั้นตอนการ แยกหน้าจาก PDF โดยใช้ Python คอลเลกชันหน้าเริ่มต้นใช้ในเอกสาร PDF ต้นทางที่แยกวิเคราะห์ทีละรายการ และในการวนซ้ำแต่ละครั้ง ไฟล์ PDF ใหม่จะถูกสร้างขึ้นและหน้าปัจจุบันจะถูกเพิ่มเข้าไป เพิ่มการสิ้นสุดการวนซ้ำ ไฟล์ PDF ที่เป็นผลลัพธ์จะถูกบันทึกเป็นไฟล์ PDF แยกต่างหากโดยใช้ชื่ออื่น

รหัสเพื่อแยกหน้า PDF โดยใช้ Python

โค้ดด้านบนแสดงขั้นตอนการ แยกหน้า PDF โดยใช้ Python ขั้นแรก ไฟล์ PDF ต้นฉบับที่มีหลายหน้าจะถูกโหลดลงในออบเจกต์คลาส Document จากนั้นใช้ for วนซ้ำเพื่อแยกวิเคราะห์หน้าทั้งหมดในคอลเล็กชัน Document.pages ในระหว่างการทำซ้ำ คุณอาจใช้การตรวจสอบต่างๆ เช่น หมายเลขหน้า หรือค้นหาเนื้อหาบางอย่างในนั้นก่อนที่จะแยกเป็นไฟล์ PDF แยกต่างหาก หรือปรับแต่งไฟล์ PDF เอาต์พุตโดยใช้วัตถุคลาส PdfSaveOptions สำหรับไฟล์ PDF ที่สร้างขึ้นใหม่

บทช่วยสอนสั้นๆ นี้แนะนำเราให้ แยกไฟล์ PDF โดยใช้ Python หากคุณต้องการเรียนรู้ขั้นตอนการรวมไฟล์ PDF หลายไฟล์เป็นไฟล์ PDF เดียว โปรดดูบทความใน วิธีผสาน PDF โดยใช้ Python

 ไทย