Ստեղծեք բովանդակության աղյուսակ PDF-ում՝ օգտագործելով Python-ը

Այս թեման ներառում է Python-ի միջոցով PDF-ում բովանդակության աղյուսակ ստեղծելու գործընթացը: Այն ընդգրկում է զարգացման միջավայրի ստեղծման մանրամասները, քայլերի ցանկը և աշխատանքային ծածկագիրը՝ PDF-ում բովանդակության աղյուսակ ավելացնելու համար՝ օգտագործելով Python: Դուք նաև կիմանաք բովանդակության աղյուսակի կոնֆիգուրացիաների մասին, ներառյալ հիպերհղումները, տեքստը և PDF ֆայլի տարբեր էջերի հետ կապը:

Python-ի միջոցով PDF-ում բովանդակության աղյուսակ ավելացնելու քայլեր

  1. Բովանդակության աղյուսակ ավելացնելու համար միջավայրը սահմանեք օգտագործել Aspose.PDF-ը Python-ի համար .NET-ի միջոցով
  2. Մուտք գործեք օրինակ PDF Document և սկզբում տեղադրեք էջ TOC ավելացնելու համար
  3. Ստեղծեք TocInfo և TextFragment դասերի օրինակներ TOC անվանումը սահմանելու համար
  4. Սահմանեք վերնագրերի տեքստը բովանդակության աղյուսակի համար
  5. Կրկնեք բոլոր PDF էջերը՝ համապատասխան TOC վերնագիր ավելացնելու համար
  6. Սահմանեք թիրախային էջը, դրա կոորդինատները և վերնագրի տեքստը յուրաքանչյուր կրկնության ընթացքում
  7. Պահպանեք ստացված PDF ֆայլը, որն ունի TOC առաջին էջում

Վերոնշյալ քայլերը ցույց են տալիս, որ ** PDF-ում կտտացնելով բովանդակության աղյուսակ ստեղծելու գործընթացը՝ օգտագործելով Python**: Մուտք գործեք սկզբնաղբյուր PDF ֆայլը, փաստաթղթի սկզբում ավելացրեք էջ՝ բովանդակության աղյուսակը պահելու համար և օգտագործեք TocInfo-ի և TextFragment-ի օրինակները՝ TOC-ի բնութագրերը սահմանելու համար: Բեռնված PDF փաստաթղթի յուրաքանչյուր էջի համար բովանդակության աղյուսակում տեղադրեք հիպերհղում, սահմանեք դրա տեքստը և հղումը դեպի պահանջվող էջը:

Կոդ՝ Python-ի միջոցով PDF-ում սեղմվող բովանդակության աղյուսակ ավելացնելու համար

import aspose.pdf as pdf
# Set the source directory path
filePath = "C://Words//"
# Load the license in your application to create TOC in PDF
pdf.License().set_license(filePath + "Conholdate.Total.Product.Family.lic")
# Open the sample PDF document file from the disk
pdfDoc = pdf.Document(filePath + "Sample.pdf")
# Insert a page for table of contents
pageTOC = pdfDoc.pages.insert(1)
# Instantiate an object of TocInfo for TOC information
tocInfo = pdf.TocInfo()
# Create an object of TextFragment for setting TOC title
title = pdf.text.TextFragment("Table Of Contents")
title.text_state.font_size = 20
# Set the title for Table of contents
tocInfo.title = title
pageTOC.toc_info = tocInfo
# Generate a list of strings for TOC
tocTitles = []
# Get count of pages in the PDF
count = pdfDoc.pages.length
for j in range(0, count):
tocTitles.insert(j, "Page "+ str(j + 1))
i = 0
while i < count:
# Instantiate an object of the Heading class
heading = pdf.Heading(1)
heading.toc_page = pageTOC
# Set the destination page for the heading object
heading.destination_page = pdfDoc.pages[i + 1]
# Set the destination coordinates for TOC item
heading.top = pdfDoc.pages[i +1].rect.height
# Set TOC item text
textSegment = pdf.text.TextSegment()
textSegment.text = tocTitles[i]
segments = heading.segments.append(textSegment)
# Add heading to the TOC page
pageTOC.paragraphs.add(heading)
i += 1
# Save document with TOC
pdfDoc.save("outputwithToc.pdf")
print ("Opeartion finished successfully")

Այս օրինակը ցույց է տալիս ինչպես ավելացնել բովանդակության աղյուսակը PDF-ում՝ օգտագործելով Python: Այս օրինակում TOC-ի բովանդակությունը ձեռքով ստեղծվում է՝ ստեղծելով տողերի ցանկ՝ օգտագործելով էջի համարները: Այնուամենայնիվ, դուք կարող եք վերլուծել ֆայլի բովանդակությունը և սահմանել նմանապես ստանդարտ բովանդակության աղյուսակին, որտեղ PDF բովանդակության վերնագրերն օգտագործվում են TOC-ի ներսում և դրանք կապել PDF ֆայլի ցանկալի բովանդակության հետ:

Այս թեման մեզ սովորեցրել է ինչպես ստեղծել PDF բովանդակության աղյուսակ՝ օգտագործելով Python: Եթե դուք հետաքրքրված եք PDF ֆայլի բովանդակության մեջ հիպերհղումներ ավելացնելով, տես ինչպես ավելացնել հիպերհղումը PDF-ում Python-ի միջոցով-ի հոդվածը:

 Հայերեն