Tutorial singkat ini memandu cara mengonversi URL ke PDF dengan Python. Berisi semua detail untuk menyiapkan IDE, daftar langkah, dan contoh kode untuk mengubah link menjadi PDF dengan Python. Anda akan belajar menyesuaikan file PDF keluaran dengan mengatur berbagai parameter sesuai kebutuhan Anda.
Langkah-langkah Mengonversi Halaman Web ke PDF dengan Python
- Siapkan lingkungan untuk menggunakan Aspose.PDF untuk Python via .NET untuk mengonversi URL ke PDF
- Tentukan URL halaman web dan deklarasikan HtmlLoadOptions untuk menyesuaikan pengaturan halaman keluaran
- Kirim permintaan GET ke URL yang ditentukan dan dapatkan konten halaman sebagai aliran byte
- Buat dokumen PDF dari aliran halaman web
- Simpan dokumen keluaran sebagai file PDF
Langkah-langkah ini menjelaskan konversi URL ke PDF dengan Python. Tentukan URL target, opsi halaman PDF keluaran, dan kirim permintaan GET untuk mengambil konten halaman web. Muat aliran halaman web ke objek kelas Document dan simpan dokumen keluaran sebagai PDF.
Kode untuk Mengubah Link ke Dokumen PDF dengan Python
# Import necessary modules | |
import requests # For making HTTP requests to fetch webpage content | |
from io import BytesIO # To handle byte stream data | |
from aspose.pdf import Document # Import Aspose PDF's Document class for PDF operations | |
import aspose.pdf as ap # Import Aspose PDF module for additional functionality | |
def fetch_web_content_as_stream(webpage_url): | |
""" | |
Fetches the content of a webpage and returns it as a byte stream. | |
Parameters: | |
webpage_url (str): The URL of the webpage to fetch. | |
Returns: | |
BytesIO: A byte stream of the webpage content. | |
""" | |
response = requests.get(webpage_url) # Send GET request to the specified URL | |
response.raise_for_status() # Raise an error if the request fails | |
return BytesIO(response.content) # Return the content as a byte stream | |
def main(): | |
""" | |
Main function that converts a webpage into a PDF document. | |
""" | |
# Set Aspose.PDF license (assumes "license.lic" file is available) | |
license = ap.License() | |
license.set_license("license.lic") | |
# Define the webpage URL to be converted | |
webpage_url = "https://docs.aspose.com/" | |
# Configure HTML-to-PDF conversion options | |
pdf_options = ap.HtmlLoadOptions(webpage_url) # Create HTML load options with the webpage URL | |
pdf_options.page_info.width = 1200 # Set PDF page width | |
pdf_options.page_info.height = 850 # Set PDF page height | |
# Fetch webpage content as a byte stream | |
with fetch_web_content_as_stream(webpage_url) as web_stream: | |
# Uncomment the lines below to print and inspect the webpage content | |
# print(web_stream.read().decode('utf-8', errors='ignore')) | |
# web_stream.seek(0) # Reset the stream position after reading | |
# Create a PDF document from the webpage stream | |
pdf_document = Document(web_stream, pdf_options) | |
# Save the converted PDF document | |
pdf_document.save("Converted_WebPage.pdf") | |
print("URL converted to PDF successfully") | |
# Run the main function if the script is executed directly | |
if __name__ == "__main__": | |
main() |
Kode ini menunjukkan konverter link URL ke PDF dengan Python. Atur penangan peringatan untuk mengimplementasikan fungsi callback untuk kesalahan konversi, flag untuk merender konten pada satu halaman, dan pengkodean input. Anda dapat membaca aliran dan mencetaknya dengan membatalkan komentar dua baris kode untuk memeriksa konten halaman web.
Artikel ini telah mengajarkan kita cara mengonversi URL ke PDF. Untuk mengonversi konten HTML ke PDF, lihat artikel tentang cara mengonversi HTML ke PDF dengan Python.