Μετατροπή URL σε PDF με Python

Αυτός ο σύντομος οδηγός καθοδηγεί πώς να μετατρέψετε μια URL σε PDF με Python. Περιέχει όλες τις λεπτομέρειες για τη ρύθμιση του περιβάλλοντος, λίστα βημάτων και παράδειγμα κώδικα για τη μετατροπή συνδέσμου σε PDF με Python. Θα μάθετε πώς να προσαρμόσετε το παραγόμενο PDF αρχείο ορίζοντας διάφορες παραμέτρους σύμφωνα με τις ανάγκες σας.

Βήματα για τη μετατροπή ιστοσελίδας σε PDF με Python

  1. Ρυθμίστε το περιβάλλον για τη χρήση του Aspose.PDF για Python μέσω .NET για τη μετατροπή URL σε PDF
  2. Ορίστε τη διεύθυνση URL και δηλώστε τις HtmlLoadOptions για την προσαρμογή της εξόδου
  3. Στείλτε ένα αίτημα GET στη συγκεκριμένη URL και λάβετε το περιεχόμενο της σελίδας ως ροή byte
  4. Δημιουργήστε ένα PDF έγγραφο από τη ροή της ιστοσελίδας
  5. Αποθηκεύστε το παραγόμενο έγγραφο ως αρχείο PDF

Αυτά τα βήματα περιγράφουν τη διαδικασία μετατροπής URL σε PDF με Python. Ορίστε την επιθυμητή URL, τις επιλογές σελίδας για το παραγόμενο PDF και στείλτε ένα αίτημα GET για να λάβετε το περιεχόμενο της ιστοσελίδας. Φορτώστε τη ροή της ιστοσελίδας σε ένα αντικείμενο της κλάσης Document και αποθηκεύστε το παραγόμενο έγγραφο ως PDF.

Κώδικας για τη μετατροπή συνδέσμου σε PDF έγγραφο με Python

# Import necessary modules
import requests # For making HTTP requests to fetch webpage content
from io import BytesIO # To handle byte stream data
from aspose.pdf import Document # Import Aspose PDF's Document class for PDF operations
import aspose.pdf as ap # Import Aspose PDF module for additional functionality
def fetch_web_content_as_stream(webpage_url):
"""
Fetches the content of a webpage and returns it as a byte stream.
Parameters:
webpage_url (str): The URL of the webpage to fetch.
Returns:
BytesIO: A byte stream of the webpage content.
"""
response = requests.get(webpage_url) # Send GET request to the specified URL
response.raise_for_status() # Raise an error if the request fails
return BytesIO(response.content) # Return the content as a byte stream
def main():
"""
Main function that converts a webpage into a PDF document.
"""
# Set Aspose.PDF license (assumes "license.lic" file is available)
license = ap.License()
license.set_license("license.lic")
# Define the webpage URL to be converted
webpage_url = "https://docs.aspose.com/"
# Configure HTML-to-PDF conversion options
pdf_options = ap.HtmlLoadOptions(webpage_url) # Create HTML load options with the webpage URL
pdf_options.page_info.width = 1200 # Set PDF page width
pdf_options.page_info.height = 850 # Set PDF page height
# Fetch webpage content as a byte stream
with fetch_web_content_as_stream(webpage_url) as web_stream:
# Uncomment the lines below to print and inspect the webpage content
# print(web_stream.read().decode('utf-8', errors='ignore'))
# web_stream.seek(0) # Reset the stream position after reading
# Create a PDF document from the webpage stream
pdf_document = Document(web_stream, pdf_options)
# Save the converted PDF document
pdf_document.save("Converted_WebPage.pdf")
print("URL converted to PDF successfully")
# Run the main function if the script is executed directly
if __name__ == "__main__":
main()

Αυτός ο κώδικας δείχνει τη διαδικασία μετατροπής συνδέσμου σε PDF με Python. Ορίστε έναν χειριστή προειδοποιήσεων για την υλοποίηση μιας συνάρτησης ανάκλησης σε περίπτωση σφαλμάτων κατά τη μετατροπή, μια σημαία για την απόδοση του περιεχομένου σε μία σελίδα και την κωδικοποίηση εισόδου. Μπορείτε να διαβάσετε τη ροή και να την εκτυπώσετε, αφαιρώντας τα σχόλια από δύο γραμμές κώδικα, για να ελέγξετε το περιεχόμενο της ιστοσελίδας.

Αυτό το άρθρο μας δίδαξε πώς να μετατρέψουμε μια URL σε PDF. Για να μετατρέψετε HTML περιεχόμενο σε PDF, δείτε το άρθρο σχετικά με το πώς να μετατρέψετε HTML σε PDF με Python.

 Ελληνικά