Utwórz spis treści w formacie PDF przy użyciu języka Python

Ten temat dotyczy procesu tworzenia spisu treści w PDF przy użyciu języka Python. Zawiera szczegółowe informacje dotyczące ustanawiania środowiska programistycznego, listę kroków i działający kod umożliwiający dodanie spisu treści w formacie PDF przy użyciu języka Python. Dowiesz się również o konfiguracjach spisu treści, w tym hiperłączy, tekstu i łączności z różnymi stronami pliku PDF.

Kroki, aby dodać spis treści do pliku PDF za pomocą języka Python

  1. Ustaw środowisko na użyj Aspose.PDF dla Pythona za pośrednictwem .NET, aby dodać spis treści
  2. Uzyskaj dostęp do przykładowego pliku PDF Document i wstaw na początku stronę w celu dodania spisu treści
  3. Utwórz instancje klas TocInfo i TextFragment w celu ustawienia tytułu spisu treści
  4. Ustaw tekst nagłówków spisu treści
  5. Przeglądaj wszystkie strony PDF, aby dodać odpowiedni nagłówek spisu treści
  6. Ustaw stronę docelową, jej współrzędne i tekst nagłówka podczas każdej iteracji
  7. Zapisz powstały plik PDF ze spisem treści na pierwszej stronie

Powyższe kroki przedstawiają proces tworzenia klikalnego spisu treści w formacie PDF przy użyciu języka Python. Uzyskaj dostęp do źródłowego pliku PDF, dodaj stronę na początku dokumentu, w której będzie przechowywany spis treści, i użyj wystąpień TocInfo i TextFragment, aby ustawić charakterystykę spisu treści. Dla każdej strony załadowanego dokumentu PDF wstaw hiperłącze w spisie treści, ustaw jej tekst i link do żądanej strony.

Kod umożliwiający dodanie klikalnego spisu treści do pliku PDF przy użyciu języka Python

import aspose.pdf as pdf
# Set the source directory path
filePath = "C://Words//"
# Load the license in your application to create TOC in PDF
pdf.License().set_license(filePath + "Conholdate.Total.Product.Family.lic")
# Open the sample PDF document file from the disk
pdfDoc = pdf.Document(filePath + "Sample.pdf")
# Insert a page for table of contents
pageTOC = pdfDoc.pages.insert(1)
# Instantiate an object of TocInfo for TOC information
tocInfo = pdf.TocInfo()
# Create an object of TextFragment for setting TOC title
title = pdf.text.TextFragment("Table Of Contents")
title.text_state.font_size = 20
# Set the title for Table of contents
tocInfo.title = title
pageTOC.toc_info = tocInfo
# Generate a list of strings for TOC
tocTitles = []
# Get count of pages in the PDF
count = pdfDoc.pages.length
for j in range(0, count):
tocTitles.insert(j, "Page "+ str(j + 1))
i = 0
while i < count:
# Instantiate an object of the Heading class
heading = pdf.Heading(1)
heading.toc_page = pageTOC
# Set the destination page for the heading object
heading.destination_page = pdfDoc.pages[i + 1]
# Set the destination coordinates for TOC item
heading.top = pdfDoc.pages[i +1].rect.height
# Set TOC item text
textSegment = pdf.text.TextSegment()
textSegment.text = tocTitles[i]
segments = heading.segments.append(textSegment)
# Add heading to the TOC page
pageTOC.paragraphs.add(heading)
i += 1
# Save document with TOC
pdfDoc.save("outputwithToc.pdf")
print ("Opeartion finished successfully")

Ten przykład pokazuje jak dodać spis treści w formacie PDF przy użyciu języka Python. W tym przykładzie zawartość spisu treści jest generowana ręcznie poprzez wygenerowanie listy ciągów znaków na podstawie numerów stron. Można jednak przeanalizować zawartość pliku i ustawić podobnie jak w przypadku standardowego spisu treści, w którym nagłówki z zawartości pliku PDF są używane w spisie treści i łączyć je z żądaną treścią w pliku PDF.

Ten temat nauczył nas jak utworzyć spis treści w formacie PDF przy użyciu języka Python. Jeśli jesteś zainteresowany dodaniem hiperłączy w treści pliku PDF, zapoznaj się z artykułem na temat jak dodać hiperłącze w formacie PDF za pomocą Pythona.

 Polski