Konvertierung von URL in PDF mit Python

Diese kurze Anleitung zeigt, wie Sie eine URL mit PDF und Python konvertieren. Sie enthält alle Details zur Einrichtung der IDE, eine Schritt-für-Schritt-Anleitung und Beispielcode, um einen Link in PDF mit Python umzuwandeln. Sie lernen, wie Sie das Ausgabe-PDF-Dokument anpassen, indem Sie verschiedene Parameter nach Ihren Anforderungen einstellen.

Schritte zur Konvertierung einer Webseite in PDF mit Python

  1. Richten Sie die Umgebung für die Verwendung von Aspose.PDF für Python via .NET ein, um eine URL in PDF zu konvertieren
  2. Definieren Sie die URL der Webseite und deklarieren Sie HtmlLoadOptions, um das Layout der Ausgabeseite anzupassen
  3. Senden Sie die GET-Anfrage an die angegebene URL und erhalten Sie den Inhalt der Seite als Bytestrom
  4. Erzeugen Sie ein PDF Dokument aus dem Datenstrom der Webseite
  5. Speichern Sie das erstellte Dokument als PDF-Datei

Diese Schritte beschreiben die Umwandlung von URL in PDF mit Python. Legen Sie die Ziel-URL fest, konfigurieren Sie die Seitenoptionen für das Ausgabe-PDF und senden Sie eine GET-Anfrage, um den Inhalt der Webseite abzurufen. Laden Sie den Datenstrom der Webseite in ein Objekt der Document-Klasse und speichern Sie das erstellte Dokument als PDF.

# Import necessary modules
import requests # For making HTTP requests to fetch webpage content
from io import BytesIO # To handle byte stream data
from aspose.pdf import Document # Import Aspose PDF's Document class for PDF operations
import aspose.pdf as ap # Import Aspose PDF module for additional functionality
def fetch_web_content_as_stream(webpage_url):
"""
Fetches the content of a webpage and returns it as a byte stream.
Parameters:
webpage_url (str): The URL of the webpage to fetch.
Returns:
BytesIO: A byte stream of the webpage content.
"""
response = requests.get(webpage_url) # Send GET request to the specified URL
response.raise_for_status() # Raise an error if the request fails
return BytesIO(response.content) # Return the content as a byte stream
def main():
"""
Main function that converts a webpage into a PDF document.
"""
# Set Aspose.PDF license (assumes "license.lic" file is available)
license = ap.License()
license.set_license("license.lic")
# Define the webpage URL to be converted
webpage_url = "https://docs.aspose.com/"
# Configure HTML-to-PDF conversion options
pdf_options = ap.HtmlLoadOptions(webpage_url) # Create HTML load options with the webpage URL
pdf_options.page_info.width = 1200 # Set PDF page width
pdf_options.page_info.height = 850 # Set PDF page height
# Fetch webpage content as a byte stream
with fetch_web_content_as_stream(webpage_url) as web_stream:
# Uncomment the lines below to print and inspect the webpage content
# print(web_stream.read().decode('utf-8', errors='ignore'))
# web_stream.seek(0) # Reset the stream position after reading
# Create a PDF document from the webpage stream
pdf_document = Document(web_stream, pdf_options)
# Save the converted PDF document
pdf_document.save("Converted_WebPage.pdf")
print("URL converted to PDF successfully")
# Run the main function if the script is executed directly
if __name__ == "__main__":
main()

Dieser Code demonstriert den URL-zu-PDF-Konverter mit Python. Richten Sie den Warnungs-Handler ein, um eine Callback-Funktion bei Konvertierungsfehlern zu implementieren, setzen Sie ein Flag, um den Inhalt auf einer einzigen Seite darzustellen, und legen Sie die Eingabecodierung fest. Sie können den Datenstrom lesen und ausgeben, indem Sie zwei Codezeilen zum Überprüfen des Seiteninhalts auskommentieren.

Dieser Artikel zeigt, wie wir URL in PDF konvertieren. Um HTML-Inhalt in PDF zu konvertieren, lesen Sie bitte den Artikel über die Konvertierung von HTML in PDF mit Python.

 Deutsch