Այս թեման ներառում է Python-ի միջոցով PDF-ում բովանդակության աղյուսակ ստեղծելու գործընթացը: Այն ընդգրկում է զարգացման միջավայրի ստեղծման մանրամասները, քայլերի ցանկը և աշխատանքային ծածկագիրը՝ PDF-ում բովանդակության աղյուսակ ավելացնելու համար՝ օգտագործելով Python: Դուք նաև կիմանաք բովանդակության աղյուսակի կոնֆիգուրացիաների մասին, ներառյալ հիպերհղումները, տեքստը և PDF ֆայլի տարբեր էջերի հետ կապը:
Python-ի միջոցով PDF-ում բովանդակության աղյուսակ ավելացնելու քայլեր
- Բովանդակության աղյուսակ ավելացնելու համար միջավայրը սահմանեք օգտագործել Aspose.PDF-ը Python-ի համար .NET-ի միջոցով
- Մուտք գործեք օրինակ PDF Document և սկզբում տեղադրեք էջ TOC ավելացնելու համար
- Ստեղծեք TocInfo և TextFragment դասերի օրինակներ TOC անվանումը սահմանելու համար
- Սահմանեք վերնագրերի տեքստը բովանդակության աղյուսակի համար
- Կրկնեք բոլոր PDF էջերը՝ համապատասխան TOC վերնագիր ավելացնելու համար
- Սահմանեք թիրախային էջը, դրա կոորդինատները և վերնագրի տեքստը յուրաքանչյուր կրկնության ընթացքում
- Պահպանեք ստացված PDF ֆայլը, որն ունի TOC առաջին էջում
Վերոնշյալ քայլերը ցույց են տալիս, որ ** PDF-ում կտտացնելով բովանդակության աղյուսակ ստեղծելու գործընթացը՝ օգտագործելով Python**: Մուտք գործեք սկզբնաղբյուր PDF ֆայլը, փաստաթղթի սկզբում ավելացրեք էջ՝ բովանդակության աղյուսակը պահելու համար և օգտագործեք TocInfo-ի և TextFragment-ի օրինակները՝ TOC-ի բնութագրերը սահմանելու համար: Բեռնված PDF փաստաթղթի յուրաքանչյուր էջի համար բովանդակության աղյուսակում տեղադրեք հիպերհղում, սահմանեք դրա տեքստը և հղումը դեպի պահանջվող էջը:
Կոդ՝ Python-ի միջոցով PDF-ում սեղմվող բովանդակության աղյուսակ ավելացնելու համար
import aspose.pdf as pdf | |
# Set the source directory path | |
filePath = "C://Words//" | |
# Load the license in your application to create TOC in PDF | |
pdf.License().set_license(filePath + "Conholdate.Total.Product.Family.lic") | |
# Open the sample PDF document file from the disk | |
pdfDoc = pdf.Document(filePath + "Sample.pdf") | |
# Insert a page for table of contents | |
pageTOC = pdfDoc.pages.insert(1) | |
# Instantiate an object of TocInfo for TOC information | |
tocInfo = pdf.TocInfo() | |
# Create an object of TextFragment for setting TOC title | |
title = pdf.text.TextFragment("Table Of Contents") | |
title.text_state.font_size = 20 | |
# Set the title for Table of contents | |
tocInfo.title = title | |
pageTOC.toc_info = tocInfo | |
# Generate a list of strings for TOC | |
tocTitles = [] | |
# Get count of pages in the PDF | |
count = pdfDoc.pages.length | |
for j in range(0, count): | |
tocTitles.insert(j, "Page "+ str(j + 1)) | |
i = 0 | |
while i < count: | |
# Instantiate an object of the Heading class | |
heading = pdf.Heading(1) | |
heading.toc_page = pageTOC | |
# Set the destination page for the heading object | |
heading.destination_page = pdfDoc.pages[i + 1] | |
# Set the destination coordinates for TOC item | |
heading.top = pdfDoc.pages[i +1].rect.height | |
# Set TOC item text | |
textSegment = pdf.text.TextSegment() | |
textSegment.text = tocTitles[i] | |
segments = heading.segments.append(textSegment) | |
# Add heading to the TOC page | |
pageTOC.paragraphs.add(heading) | |
i += 1 | |
# Save document with TOC | |
pdfDoc.save("outputwithToc.pdf") | |
print ("Opeartion finished successfully") |
Այս օրինակը ցույց է տալիս ինչպես ավելացնել բովանդակության աղյուսակը PDF-ում՝ օգտագործելով Python: Այս օրինակում TOC-ի բովանդակությունը ձեռքով ստեղծվում է՝ ստեղծելով տողերի ցանկ՝ օգտագործելով էջի համարները: Այնուամենայնիվ, դուք կարող եք վերլուծել ֆայլի բովանդակությունը և սահմանել նմանապես ստանդարտ բովանդակության աղյուսակին, որտեղ PDF բովանդակության վերնագրերն օգտագործվում են TOC-ի ներսում և դրանք կապել PDF ֆայլի ցանկալի բովանդակության հետ:
Այս թեման մեզ սովորեցրել է ինչպես ստեղծել PDF բովանդակության աղյուսակ՝ օգտագործելով Python: Եթե դուք հետաքրքրված եք PDF ֆայլի բովանդակության մեջ հիպերհղումներ ավելացնելով, տես ինչպես ավելացնել հիպերհղումը PDF-ում Python-ի միջոցով-ի հոդվածը: