Перетворення URL у PDF за допомогою Python

Цей короткий посібник пояснює, як перетворити URL у PDF за допомогою Python. Він містить усі деталі налаштування середовища, перелік кроків і зразок коду для конвертації посилання у PDF за допомогою Python. Ви також навчитеся налаштовувати параметри вихідного PDF-файлу відповідно до ваших вимог.

Кроки для перетворення веб-сторінки у PDF за допомогою Python

  1. Налаштуйте середовище для використання Aspose.PDF for Python via .NET для перетворення URL у PDF
  2. Визначте URL веб-сторінки та встановіть HtmlLoadOptions для налаштування параметрів вихідного PDF
  3. Відправте GET-запит на вказаний URL і отримайте вміст сторінки у вигляді потоку байтів
  4. Створіть PDF-документ із потоку веб-сторінки
  5. Збережіть вихідний документ у форматі PDF

Ці кроки описують процес перетворення URL у PDF за допомогою Python. Вкажіть цільовий URL, налаштуйте параметри сторінки PDF і відправте GET-запит для отримання вмісту сторінки. Завантажте потік веб-сторінки в об’єкт класу Document і збережіть вихідний документ у форматі PDF.

Код для перетворення посилання у PDF-документ за допомогою Python

# Import necessary modules
import requests # For making HTTP requests to fetch webpage content
from io import BytesIO # To handle byte stream data
from aspose.pdf import Document # Import Aspose PDF's Document class for PDF operations
import aspose.pdf as ap # Import Aspose PDF module for additional functionality
def fetch_web_content_as_stream(webpage_url):
"""
Fetches the content of a webpage and returns it as a byte stream.
Parameters:
webpage_url (str): The URL of the webpage to fetch.
Returns:
BytesIO: A byte stream of the webpage content.
"""
response = requests.get(webpage_url) # Send GET request to the specified URL
response.raise_for_status() # Raise an error if the request fails
return BytesIO(response.content) # Return the content as a byte stream
def main():
"""
Main function that converts a webpage into a PDF document.
"""
# Set Aspose.PDF license (assumes "license.lic" file is available)
license = ap.License()
license.set_license("license.lic")
# Define the webpage URL to be converted
webpage_url = "https://docs.aspose.com/"
# Configure HTML-to-PDF conversion options
pdf_options = ap.HtmlLoadOptions(webpage_url) # Create HTML load options with the webpage URL
pdf_options.page_info.width = 1200 # Set PDF page width
pdf_options.page_info.height = 850 # Set PDF page height
# Fetch webpage content as a byte stream
with fetch_web_content_as_stream(webpage_url) as web_stream:
# Uncomment the lines below to print and inspect the webpage content
# print(web_stream.read().decode('utf-8', errors='ignore'))
# web_stream.seek(0) # Reset the stream position after reading
# Create a PDF document from the webpage stream
pdf_document = Document(web_stream, pdf_options)
# Save the converted PDF document
pdf_document.save("Converted_WebPage.pdf")
print("URL converted to PDF successfully")
# Run the main function if the script is executed directly
if __name__ == "__main__":
main()

Цей код демонструє перетворення URL у PDF-конвертер за допомогою Python. Налаштуйте обробник попереджень для реалізації функції зворотного виклику у разі помилок конвертації, встановіть прапорець для відображення вмісту на одній сторінці та налаштуйте кодування вхідних даних. Ви можете прочитати потік і вивести його на екран, розкоментувавши два рядки коду для перевірки вмісту веб-сторінки.

У цій статті ми розглянули, як перетворити URL у PDF. Щоб дізнатися більше про конвертацію HTML у PDF, ознайомтеся зі статтею Як перетворити HTML у PDF у Python.

 Українська