Převod URL na PDF pomocí Pythonu

Tento rychlý návod ukazuje, jak převést URL na PDF pomocí Pythonu. Obsahuje všechny detaily potřebné pro nastavení vývojového prostředí, seznam kroků a ukázkový kód pro transformaci odkazu na PDF pomocí Pythonu. Naučíte se přizpůsobit výstupní PDF soubor nastavením různých parametrů podle vašich požadavků.

Kroky pro převod webové stránky na PDF pomocí Pythonu

  1. Nastavte prostředí pro použití Aspose.PDF pro Python přes .NET pro převod URL na PDF
  2. Definujte URL webové stránky a deklarujte HtmlLoadOptions pro přizpůsobení nastavení výstupní stránky
  3. Odešlete GET požadavek na zadanou URL a získejte obsah stránky jako proud bajtů
  4. Vytvořte PDF dokument z proudu webové stránky
  5. Uložte výstupní dokument jako PDF soubor

Tyto kroky popisují převod URL na PDF pomocí Pythonu. Nastavte cílovou URL, možnosti stránky pro výstupní PDF a odešlete GET požadavek pro získání obsahu webové stránky. Načtěte proud webové stránky do objektu třídy Document a uložte výstupní dokument jako PDF.

Kód pro převod odkazu na PDF dokument pomocí Pythonu

# Import necessary modules
import requests # For making HTTP requests to fetch webpage content
from io import BytesIO # To handle byte stream data
from aspose.pdf import Document # Import Aspose PDF's Document class for PDF operations
import aspose.pdf as ap # Import Aspose PDF module for additional functionality
def fetch_web_content_as_stream(webpage_url):
"""
Fetches the content of a webpage and returns it as a byte stream.
Parameters:
webpage_url (str): The URL of the webpage to fetch.
Returns:
BytesIO: A byte stream of the webpage content.
"""
response = requests.get(webpage_url) # Send GET request to the specified URL
response.raise_for_status() # Raise an error if the request fails
return BytesIO(response.content) # Return the content as a byte stream
def main():
"""
Main function that converts a webpage into a PDF document.
"""
# Set Aspose.PDF license (assumes "license.lic" file is available)
license = ap.License()
license.set_license("license.lic")
# Define the webpage URL to be converted
webpage_url = "https://docs.aspose.com/"
# Configure HTML-to-PDF conversion options
pdf_options = ap.HtmlLoadOptions(webpage_url) # Create HTML load options with the webpage URL
pdf_options.page_info.width = 1200 # Set PDF page width
pdf_options.page_info.height = 850 # Set PDF page height
# Fetch webpage content as a byte stream
with fetch_web_content_as_stream(webpage_url) as web_stream:
# Uncomment the lines below to print and inspect the webpage content
# print(web_stream.read().decode('utf-8', errors='ignore'))
# web_stream.seek(0) # Reset the stream position after reading
# Create a PDF document from the webpage stream
pdf_document = Document(web_stream, pdf_options)
# Save the converted PDF document
pdf_document.save("Converted_WebPage.pdf")
print("URL converted to PDF successfully")
# Run the main function if the script is executed directly
if __name__ == "__main__":
main()

Tento kód demonstruje konvertor odkazu na PDF pomocí Pythonu. Nastavte obsluhu varování pro implementaci zpětného volání při chybách převodu, příznak pro vykreslení obsahu na jedné stránce a kódování vstupu. Můžete číst proud a vytisknout jej odkomentováním dvou řádků kódu pro kontrolu obsahu webové stránky.

Tento článek nás naučil, jak převést URL na PDF. Pro převod HTML obsahu na PDF si přečtěte článek o tom, jak převést HTML na PDF v Pythonu.

 Čeština