Ce tutoriel rapide explique comment convertir une URL en PDF avec Python. Il contient tous les détails pour configurer l’IDE, une liste d’étapes et un exemple de code pour transformer un lien en PDF avec Python. Vous apprendrez à personnaliser le fichier PDF de sortie en définissant divers paramètres selon vos besoins.
Étapes pour convertir une page web en PDF avec Python
- Configurer l’environnement pour utiliser Aspose.PDF pour Python via .NET pour convertir une URL en PDF
- Définir l’URL de la page web et déclarer HtmlLoadOptions pour personnaliser la configuration de la page de sortie
- Envoyer une requête GET à l’URL spécifiée et obtenir le contenu de la page sous forme de flux d’octets
- Créer un document PDF à partir du flux de la page web
- Enregistrer le document de sortie en tant que fichier PDF
Ces étapes décrivent la conversion d’une URL en PDF avec Python. Définissez l’URL cible, les options de la page PDF de sortie et envoyez une requête GET pour récupérer le contenu de la page web. Chargez le flux de la page web dans l’objet de la classe Document et enregistrez le document de sortie en tant que fichier PDF.
Code pour transformer un lien en document PDF avec Python
# Import necessary modules | |
import requests # For making HTTP requests to fetch webpage content | |
from io import BytesIO # To handle byte stream data | |
from aspose.pdf import Document # Import Aspose PDF's Document class for PDF operations | |
import aspose.pdf as ap # Import Aspose PDF module for additional functionality | |
def fetch_web_content_as_stream(webpage_url): | |
""" | |
Fetches the content of a webpage and returns it as a byte stream. | |
Parameters: | |
webpage_url (str): The URL of the webpage to fetch. | |
Returns: | |
BytesIO: A byte stream of the webpage content. | |
""" | |
response = requests.get(webpage_url) # Send GET request to the specified URL | |
response.raise_for_status() # Raise an error if the request fails | |
return BytesIO(response.content) # Return the content as a byte stream | |
def main(): | |
""" | |
Main function that converts a webpage into a PDF document. | |
""" | |
# Set Aspose.PDF license (assumes "license.lic" file is available) | |
license = ap.License() | |
license.set_license("license.lic") | |
# Define the webpage URL to be converted | |
webpage_url = "https://docs.aspose.com/" | |
# Configure HTML-to-PDF conversion options | |
pdf_options = ap.HtmlLoadOptions(webpage_url) # Create HTML load options with the webpage URL | |
pdf_options.page_info.width = 1200 # Set PDF page width | |
pdf_options.page_info.height = 850 # Set PDF page height | |
# Fetch webpage content as a byte stream | |
with fetch_web_content_as_stream(webpage_url) as web_stream: | |
# Uncomment the lines below to print and inspect the webpage content | |
# print(web_stream.read().decode('utf-8', errors='ignore')) | |
# web_stream.seek(0) # Reset the stream position after reading | |
# Create a PDF document from the webpage stream | |
pdf_document = Document(web_stream, pdf_options) | |
# Save the converted PDF document | |
pdf_document.save("Converted_WebPage.pdf") | |
print("URL converted to PDF successfully") | |
# Run the main function if the script is executed directly | |
if __name__ == "__main__": | |
main() |
Ce code montre comment convertir un lien URL en PDF avec Python. Configurez le gestionnaire d’avertissements pour implémenter une fonction de rappel pour les erreurs de conversion, le drapeau pour afficher le contenu sur une seule page et l’encodage d’entrée. Vous pouvez lire le flux et l’imprimer en décommentant les deux lignes de code pour inspecter le contenu de la page web.
Cet article nous a appris à convertir une URL en PDF. Pour convertir du contenu HTML en PDF, consultez l’article sur comment convertir HTML en PDF en Python.