Tạo mục lục bằng PDF bằng Python

Chủ đề này bao gồm quy trình tạo bảng nội dung trong PDF bằng Python. Nó bao gồm các chi tiết để thiết lập môi trường phát triển, danh sách các bước và mã hoạt động để thêm mục lục vào PDF bằng Python. Bạn cũng sẽ biết về các cấu hình cho mục lục bao gồm siêu liên kết, văn bản và khả năng kết nối với các trang khác nhau từ tệp PDF.

Các bước để thêm mục lục vào PDF bằng Python

  1. Đặt môi trường thành sử dụng Aspose.PDF cho Python qua .NET để thêm mục lục
  2. Truy cập tệp PDF mẫu Document và chèn một trang vào đầu để thêm TOC
  3. Tạo các phiên bản của lớp TocInfo và TextFragment để đặt tiêu đề TOC
  4. Đặt văn bản tiêu đề cho mục lục
  5. Lặp lại qua tất cả các trang PDF để thêm tiêu đề TOC tương ứng
  6. Đặt trang đích, tọa độ và văn bản tiêu đề của nó trong mỗi lần lặp
  7. Lưu tệp PDF kết quả có TOC trên trang đầu tiên

Các bước trên thể hiện quy trình tạo mục lục có thể nhấp trong PDF bằng Python. Truy cập tệp PDF nguồn, thêm trang vào đầu tài liệu để giữ mục lục và sử dụng các phiên bản của TocInfo và TextFragment để đặt các đặc điểm của TOC. Đối với mỗi trang trong tài liệu PDF đã tải, hãy chèn siêu liên kết vào mục lục, đặt văn bản của nó và liên kết đến trang được yêu cầu.

Mã để thêm mục lục có thể nhấp vào PDF bằng Python

import aspose.pdf as pdf
# Set the source directory path
filePath = "C://Words//"
# Load the license in your application to create TOC in PDF
pdf.License().set_license(filePath + "Conholdate.Total.Product.Family.lic")
# Open the sample PDF document file from the disk
pdfDoc = pdf.Document(filePath + "Sample.pdf")
# Insert a page for table of contents
pageTOC = pdfDoc.pages.insert(1)
# Instantiate an object of TocInfo for TOC information
tocInfo = pdf.TocInfo()
# Create an object of TextFragment for setting TOC title
title = pdf.text.TextFragment("Table Of Contents")
title.text_state.font_size = 20
# Set the title for Table of contents
tocInfo.title = title
pageTOC.toc_info = tocInfo
# Generate a list of strings for TOC
tocTitles = []
# Get count of pages in the PDF
count = pdfDoc.pages.length
for j in range(0, count):
tocTitles.insert(j, "Page "+ str(j + 1))
i = 0
while i < count:
# Instantiate an object of the Heading class
heading = pdf.Heading(1)
heading.toc_page = pageTOC
# Set the destination page for the heading object
heading.destination_page = pdfDoc.pages[i + 1]
# Set the destination coordinates for TOC item
heading.top = pdfDoc.pages[i +1].rect.height
# Set TOC item text
textSegment = pdf.text.TextSegment()
textSegment.text = tocTitles[i]
segments = heading.segments.append(textSegment)
# Add heading to the TOC page
pageTOC.paragraphs.add(heading)
i += 1
# Save document with TOC
pdfDoc.save("outputwithToc.pdf")
print ("Opeartion finished successfully")

Ví dụ này minh họa cách thêm mục lục vào PDF bằng Python. Trong ví dụ này, nội dung TOC được tạo thủ công bằng cách tạo danh sách các chuỗi sử dụng số trang. Tuy nhiên, bạn có thể phân tích cú pháp nội dung tệp và đặt nội dung tương tự như mục lục tiêu chuẩn trong đó các tiêu đề từ nội dung PDF được sử dụng bên trong TOC và liên kết chúng với nội dung mong muốn trong tệp PDF.

Chủ đề này đã dạy chúng tôi cách tạo mục lục PDF bằng Python. Nếu bạn quan tâm đến việc thêm siêu liên kết vào nội dung của tệp PDF, hãy tham khảo bài viết trên cách thêm siêu liên kết vào PDF bằng Python.

 Tiếng Việt