วิธีค้นหาและแทนที่ข้อความใน PDF โดยใช้ Python

บทช่วยสอนฉบับย่อนี้แนะนำเกี่ยวกับ วิธีค้นหาและแทนที่ข้อความใน PDF โดยใช้ Python ประกอบด้วยข้อมูลเกี่ยวกับการกำหนดค่า IDE กระบวนการโดยละเอียดทีละขั้นตอน และโค้ดตัวอย่างที่รันได้เพื่อ ค้นหาและแทนที่คำใน pdf โดยใช้ Python คุณจะได้เรียนรู้ตัวเลือกในการค้นหาและแทนที่ข้อความในทุกหน้าของ PDF หรือในหน้าใดหน้าหนึ่งตามข้อกำหนดของแอปพลิเคชัน

ขั้นตอนในการค้นหาและแทนที่ใน PDF โดยใช้ Python

  1. ตั้งค่าสภาพแวดล้อมเป็น ใช้ Aspose.PDF สำหรับ Python ผ่าน .NET เพื่อแทนที่ข้อความ
  2. โหลดไฟล์ PDF เป้าหมายโดยใช้อ็อบเจกต์คลาส Document ที่จะค้นหาและแทนที่ข้อมูล
  3. กำหนดข้อความที่ต้องการค้นหาโดยใช้วัตถุคลาส TextFragmentAbsorber
  4. ใช้ TextAbsorber สำหรับทุกหน้าใน PDF โดยใช้วิธี Document.pages.accept()
  5. เข้าถึงคอลเลกชันของรายการที่ค้นหาทั้งหมดใน PDF ผ่านคุณสมบัติ TextFragmentAbsorber.text_fragments
  6. วนซ้ำในส่วนข้อความค้นหาทั้งหมดและตั้งค่าใหม่ตามความต้องการของคุณ
  7. บันทึกไฟล์ PDF ที่อัปเดตลงในดิสก์พร้อมข้อความที่อัปเดต

ขั้นตอนเหล่านี้สรุปกระบวนการในการ ค้นหาและแทนที่ทั้งหมดใน PDF โดยใช้ Python มีการประกาศวัตถุ TextFragmentAbsorber โดยระบุสตริงที่จะค้นหา จากนั้นเรียกเมธอด Document.pages.accept() เพื่อแยกวิเคราะห์หน้าทั้งหมดใน PDF และรวบรวมส่วนข้อความที่มีคำเป้าหมาย เมื่อชุดคำที่พบพร้อมแล้ว ตอนนี้คุณสามารถแทนที่ชิ้นส่วนทั้งหมดหรือส่วนที่เลือกด้วยคำใหม่ตามความต้องการของคุณ

รหัสเพื่อค้นหาและแทนที่ข้อความใน PDF โดยใช้ Python

รหัสนี้สาธิตกระบวนการใช้คุณลักษณะของ การค้นหา PDF และแทนที่ข้อความโดยใช้ Python รหัสนี้ใช้เมธอด Document.pages.accept() เพื่อค้นหาข้อความใน PDF ทั้งหมด อย่างไรก็ตาม หากคุณต้องการค้นหาและแทนที่ข้อความในหน้าใดหน้าหนึ่งเท่านั้น คุณสามารถเลือกหน้านั้นโดยระบุดัชนีหน้าในคอลเลกชัน Document.pages แล้วเรียกเมธอด Page.accept() คุณยังสามารถใช้วัตถุคลาส TextSearchOptions เป็นอาร์กิวเมนต์ที่สองในขณะที่สร้างอินสแตนซ์ของวัตถุ TextFragmentAbsorber เพื่อปรับแต่งการดำเนินการค้นหา

บทความนี้สอนให้เราค้นหาและแทนที่ข้อความใน PDF หากคุณต้องการเรียนรู้ขั้นตอนการค้นหาและเน้นข้อความใน PDF โปรดดูบทความใน วิธีเน้นใน PDF โดยใช้ Python

 ไทย