Deze snelle handleiding laat zien hoe je een URL naar PDF kunt converteren met Python. Het bevat alle details om de IDE in te stellen, een stappenplan en een voorbeeldcode om een link naar PDF om te zetten met Python. Je leert hoe je het uitvoer-PDF-bestand kunt aanpassen door verschillende parameters in te stellen volgens je vereisten.
Stappen om een webpagina naar PDF te converteren met Python
- Stel de omgeving in om Aspose.PDF voor Python via .NET te gebruiken om URL naar PDF te converteren
- Definieer de URL van de webpagina en declareer HtmlLoadOptions om de paginainstellingen aan te passen
- Stuur een GET-verzoek naar de opgegeven URL en ontvang de pagina-inhoud als een bytestroom
- Maak een PDF-document van de webpagina-stroom
- Sla het uitvoerdocument op als een PDF-bestand
Deze stappen beschrijven de conversie van URL naar PDF met Python. Stel de doel-URL, de uitvoer-PDF-paginainstellingen in en stuur een GET-verzoek om de inhoud van de webpagina op te halen. Laad de webpagina-stroom in het Document-klasseobject en sla het uitvoerdocument op als PDF.
Code om een link naar een PDF-document om te zetten met Python
# Import necessary modules | |
import requests # For making HTTP requests to fetch webpage content | |
from io import BytesIO # To handle byte stream data | |
from aspose.pdf import Document # Import Aspose PDF's Document class for PDF operations | |
import aspose.pdf as ap # Import Aspose PDF module for additional functionality | |
def fetch_web_content_as_stream(webpage_url): | |
""" | |
Fetches the content of a webpage and returns it as a byte stream. | |
Parameters: | |
webpage_url (str): The URL of the webpage to fetch. | |
Returns: | |
BytesIO: A byte stream of the webpage content. | |
""" | |
response = requests.get(webpage_url) # Send GET request to the specified URL | |
response.raise_for_status() # Raise an error if the request fails | |
return BytesIO(response.content) # Return the content as a byte stream | |
def main(): | |
""" | |
Main function that converts a webpage into a PDF document. | |
""" | |
# Set Aspose.PDF license (assumes "license.lic" file is available) | |
license = ap.License() | |
license.set_license("license.lic") | |
# Define the webpage URL to be converted | |
webpage_url = "https://docs.aspose.com/" | |
# Configure HTML-to-PDF conversion options | |
pdf_options = ap.HtmlLoadOptions(webpage_url) # Create HTML load options with the webpage URL | |
pdf_options.page_info.width = 1200 # Set PDF page width | |
pdf_options.page_info.height = 850 # Set PDF page height | |
# Fetch webpage content as a byte stream | |
with fetch_web_content_as_stream(webpage_url) as web_stream: | |
# Uncomment the lines below to print and inspect the webpage content | |
# print(web_stream.read().decode('utf-8', errors='ignore')) | |
# web_stream.seek(0) # Reset the stream position after reading | |
# Create a PDF document from the webpage stream | |
pdf_document = Document(web_stream, pdf_options) | |
# Save the converted PDF document | |
pdf_document.save("Converted_WebPage.pdf") | |
print("URL converted to PDF successfully") | |
# Run the main function if the script is executed directly | |
if __name__ == "__main__": | |
main() |
Deze code demonstreert de URL naar PDF-converter met Python. Stel de waarschuwingshandler in om een callback-functie te implementeren voor conversiefouten, een vlag om inhoud op één pagina weer te geven en de invoercodering. Je kunt de stroom lezen en afdrukken door de twee coderegels te de-commentariëren om de inhoud van de webpagina te inspecteren.
In dit artikel hebben we geleerd hoe we een URL naar PDF kunnen converteren. Om HTML-inhoud naar PDF te converteren, verwijzen we naar het artikel over hoe je HTML naar PDF converteert in Python.