วิธีแปลง PDF เป็น CSV โดยใช้ Python

บทช่วยสอนนี้สอน วิธีแปลง PDF เป็น CSV โดยใช้ Python ประกอบด้วยรายละเอียดการตั้งค่าสภาพแวดล้อม อัลกอริทึมทีละขั้นตอน และข้อมูลโค้ดสำหรับสร้าง ตัวแปลงไฟล์ PDF เป็น CSV ใน Python นอกจากนี้ยังกล่าวถึงการปรับแต่งต่างๆ สำหรับกระบวนการแปลงที่คุณสามารถเลือกเพื่อให้ตรงกับความต้องการของคุณ

ขั้นตอนในการแปลง PDF เป็น CSV ใน Python

  1. กำหนดค่าสภาพแวดล้อมโดยการติดตั้งไลบรารี Aspose.PDF สำหรับ Python ผ่าน .NET
  2. โหลดเอกสาร PDF ต้นทางด้วยคลาส Document เพื่อส่งออกเป็นรูปแบบ CSV
  3. เริ่มต้นวัตถุของคลาส ExcelSaveOptions
  4. กำหนดรูปแบบ CSV และส่งออกไฟล์ PDF ต้นทางเป็นไฟล์ที่คั่นด้วยเครื่องหมายจุลภาค

ขั้นตอนข้างต้นสาธิตกระบวนการ ส่งออก PDF เป็น CSV โดยใช้ Python ก่อนอื่น ให้เตรียมสภาพแวดล้อมของระบบโดยการติดตั้ง API จากนั้นโหลดเอกสาร PDF ต้นทางจากสตรีมหรือจากดิสก์ ในขั้นตอนถัดไป ให้ตั้งค่ารูปแบบ CSV และแสดงผลไฟล์เอาต์พุตที่มีค่าที่คั่นด้วยเครื่องหมายจุลภาค

รหัสเพื่อแปลง PDF เป็น CSV ใน Python

import aspose.pdf as pdf
# Load the license
license = pdf.License()
license.set_license("Aspose.Total.lic")
# Load input PDF document
document = pdf.Document("Input.pdf")
# Initialize the ExcelSaveOptions
excelSaveOptions = pdf.ExcelSaveOptions()
# Set CSV format
excelSaveOptions.format= pdf.ExcelSaveOptions.ExcelFormat.CSV
# Convert the PDF to Comma-Separated Values
document.save(filePath + "PDFToCSV.csv", excelSaveOptions)
print("Rendering process completed")

ข้อมูลโค้ดนี้แสดงให้เห็นว่าการเรียก API สองสามครั้งสามารถใช้เพื่อ เปลี่ยน PDF เป็น CSV โดยใช้ Python ภายในโครงการของคุณได้อย่างไร ก่อนบันทึกไฟล์เอาต์พุต คุณสามารถตั้งค่าคุณสมบัติต่างๆ ได้โดยใช้ ExcelSaveOptions เช่น คุณสามารถตั้งค่าแฟล็กเพื่อแทรกคอลัมน์ว่างก่อนแทรกเนื้อหา ตั้งค่าฟังก์ชันสำหรับจัดการข้อผิดพลาดระหว่างการแปลง หรือตั้งค่ารูปแบบเอาต์พุตเป็นรูปแบบอื่นที่ไม่ใช่ CSV เช่น XLSX, XLSM, ODS เป็นต้น

ในบทความนี้ คุณได้สังเกตการแปลง PDF เป็น CSV โดยใช้ Python อย่างไรก็ตาม หากคุณต้องการรวม PDF โดยใช้ Python โปรดดูบทความใน วิธีผสาน PDF โดยใช้ Python

 ไทย