หัวข้อสั้นๆ นี้อธิบาย วิธีลบลายน้ำออกจาก PDF โดยใช้ Python ซึ่งครอบคลุมทรัพยากรทั้งหมดที่จำเป็นในการสร้างสภาพแวดล้อม ขั้นตอนการพัฒนาแอปพลิเคชันทีละขั้นตอน และโค้ดตัวอย่างที่รันได้เพื่อ ลบข้อความลายน้ำออกจาก PDF โดยใช้ Python นอกจากนี้ คุณยังจะได้สัมผัสกับการทำงานกับอาร์ติแฟกต์ประเภทต่างๆ ในหน้าและการกรองอาร์ติแฟกต์ตามประเภทที่ต้องการ
ขั้นตอนในการลบลายน้ำจาก PDF โดยใช้ Python
- สร้างสภาพแวดล้อมเพื่อเพิ่ม Aspose.PDF สำหรับ Python ผ่าน .NET ในโครงการของคุณเพื่อลบลายน้ำ
- เข้าถึงไฟล์ PDF ต้นฉบับโดยใช้วัตถุคลาส Document เพื่อลบลายน้ำ
- ข้ามผ่าน artifacts ทั้งหมดในแต่ละหน้าของเอกสารและสร้างรายการสิ่งประดิษฐ์ประเภทลายน้ำ
- ลบลายน้ำทั้งหมด เมื่อรายการเต็มไปด้วยสิ่งประดิษฐ์ที่ต้องการ
- บันทึกไฟล์ PDF ที่สร้างขึ้นบนดิสก์หลังจากลบลายน้ำ
ขั้นตอนข้างต้นอธิบายขั้นตอนการ ลบลายน้ำออกจากเอกสาร PDF โดยใช้ Python โดยเปิดเผยทรัพยากร คลาส เมธอด และคุณสมบัติที่สำคัญที่จำเป็นในขณะที่พัฒนาแอปพลิเคชันนี้ ในขั้นต้น ไฟล์ PDF ต้นทางจะถูกโหลดโดยใช้ออบเจกต์คลาส Document จากนั้นหน้าทั้งหมดจะถูกสำรวจ สำหรับแต่ละหน้า สิ่งประดิษฐ์ที่เกี่ยวข้องจะถูกตรวจสอบสำหรับลายน้ำประเภทและบันทึกไว้ในรายการเพื่อนำออกเมื่อสิ้นสุดการแวะผ่าน
รหัสเพื่อลบลายน้ำออกจาก PDF โดยใช้ Python
import aspose.pdf as pdf | |
# Set the source directory path | |
filePath = "C://Words//" | |
# Load the license in your application to remove watermark | |
pdfWatermarkLicense = pdf.License() | |
pdfWatermarkLicense.set_license(filePath + "Conholdate.Total.Product.Family.lic") | |
#Open the source PDF file with a watermark on it | |
document = pdf.Document(filePath + "watermarked.pdf") | |
#Create an array to save the watermark-type artifacts | |
artifactsToBeDeleted = [] | |
#Parse through all the pages inside the loaded PDF file | |
for page in document.pages: | |
#Parse through all the artifacts inside the current page | |
for item in page.artifacts: | |
#Check if the type of the artifact is a watermark | |
if item.sub_type == pdf.Artifact.artifact_subtype.WATERMARK: | |
#Save the artifact reference in the array for deletion | |
artifactsToBeDeleted.add(item) | |
#Parse all the artifacts to be deleted | |
for item in artifactsToBeDeleted: | |
# Delete the current artifact | |
page.artifacts.delete(item) | |
#Save the resultant PDF file having no watermark in it | |
document.save(filePath + "withoutWatermark.pdf") | |
print("Watermark removed from PDF") |
รหัสนี้แสดงขั้นตอนในการพัฒนา water mark remover ใน PDF โดยใช้ Python เข้าถึงคอลเลกชัน Page.artifacts เพื่อระบุสิ่งประดิษฐ์ประเภทลายน้ำโดยการเปรียบเทียบคุณสมบัติ Subtype กับค่าตัวแจงนับ Artifact.artifact_subtype.WATERMARK เมื่ออาร์ติแฟกต์ลายน้ำทั้งหมดถูกสำรวจและรวบรวมภายในรายการ รายการนี้จะถูกแยกวิเคราะห์และลายน้ำที่เกี่ยวข้องจะถูกลบออกจากแต่ละหน้าแยกกัน
หัวข้อสั้นๆ นี้แนะนำเราให้ ลบลายน้ำออกจาก PDF โดยใช้ Python หากคุณต้องการเรียนรู้ขั้นตอนการลบลายเซ็นออกจาก PDF โปรดดูบทความใน วิธีลบลายเซ็นออกจาก PDF โดยใช้ Python