บทช่วยสอนนี้สอน วิธีแปลง PDF เป็น CSV โดยใช้ Python ประกอบด้วยรายละเอียดการตั้งค่าสภาพแวดล้อม อัลกอริทึมทีละขั้นตอน และข้อมูลโค้ดสำหรับสร้าง ตัวแปลงไฟล์ PDF เป็น CSV ใน Python นอกจากนี้ยังกล่าวถึงการปรับแต่งต่างๆ สำหรับกระบวนการแปลงที่คุณสามารถเลือกเพื่อให้ตรงกับความต้องการของคุณ
ขั้นตอนในการแปลง PDF เป็น CSV ใน Python
- กำหนดค่าสภาพแวดล้อมโดยการติดตั้งไลบรารี Aspose.PDF สำหรับ Python ผ่าน .NET
- โหลดเอกสาร PDF ต้นทางด้วยคลาส Document เพื่อส่งออกเป็นรูปแบบ CSV
- เริ่มต้นวัตถุของคลาส ExcelSaveOptions
- กำหนดรูปแบบ CSV และส่งออกไฟล์ PDF ต้นทางเป็นไฟล์ที่คั่นด้วยเครื่องหมายจุลภาค
ขั้นตอนข้างต้นสาธิตกระบวนการ ส่งออก PDF เป็น CSV โดยใช้ Python ก่อนอื่น ให้เตรียมสภาพแวดล้อมของระบบโดยการติดตั้ง API จากนั้นโหลดเอกสาร PDF ต้นทางจากสตรีมหรือจากดิสก์ ในขั้นตอนถัดไป ให้ตั้งค่ารูปแบบ CSV และแสดงผลไฟล์เอาต์พุตที่มีค่าที่คั่นด้วยเครื่องหมายจุลภาค
รหัสเพื่อแปลง PDF เป็น CSV ใน Python
import aspose.pdf as pdf | |
# Load the license | |
license = pdf.License() | |
license.set_license("Aspose.Total.lic") | |
# Load input PDF document | |
document = pdf.Document("Input.pdf") | |
# Initialize the ExcelSaveOptions | |
excelSaveOptions = pdf.ExcelSaveOptions() | |
# Set CSV format | |
excelSaveOptions.format= pdf.ExcelSaveOptions.ExcelFormat.CSV | |
# Convert the PDF to Comma-Separated Values | |
document.save(filePath + "PDFToCSV.csv", excelSaveOptions) | |
print("Rendering process completed") |
ข้อมูลโค้ดนี้แสดงให้เห็นว่าการเรียก API สองสามครั้งสามารถใช้เพื่อ เปลี่ยน PDF เป็น CSV โดยใช้ Python ภายในโครงการของคุณได้อย่างไร ก่อนบันทึกไฟล์เอาต์พุต คุณสามารถตั้งค่าคุณสมบัติต่างๆ ได้โดยใช้ ExcelSaveOptions เช่น คุณสามารถตั้งค่าแฟล็กเพื่อแทรกคอลัมน์ว่างก่อนแทรกเนื้อหา ตั้งค่าฟังก์ชันสำหรับจัดการข้อผิดพลาดระหว่างการแปลง หรือตั้งค่ารูปแบบเอาต์พุตเป็นรูปแบบอื่นที่ไม่ใช่ CSV เช่น XLSX, XLSM, ODS เป็นต้น
ในบทความนี้ คุณได้สังเกตการแปลง PDF เป็น CSV โดยใช้ Python อย่างไรก็ตาม หากคุณต้องการรวม PDF โดยใช้ Python โปรดดูบทความใน วิธีผสาน PDF โดยใช้ Python