Šis greitas vadovas nurodo, kaip konvertuoti URL į PDF naudojant Python. Jame pateikiama visa informacija, reikalinga IDE nustatymui, veiksmų sąrašas ir pavyzdinis kodas, kaip nuorodą paversti PDF naudojant Python. Sužinosite, kaip pritaikyti išvesties PDF failą, nustatydami įvairius parametrus pagal savo reikalavimus.
Veiksmai, kaip konvertuoti tinklalapį į PDF naudojant Python
- Nustatykite aplinką, kad naudotumėte Aspose.PDF for Python per .NET, norėdami konvertuoti URL į PDF
- Apibrėžkite tinklalapio URL ir deklaruokite HtmlLoadOptions, kad pritaikytumėte išvesties puslapio nustatymus
- Siųskite GET užklausą į nurodytą URL ir gaukite puslapio turinį kaip baitų srautą
- Sukurkite PDF dokumentą iš tinklalapio srauto
- Išsaugokite išvesties dokumentą kaip PDF failą
Šie veiksmai aprašo URL konvertavimą į PDF naudojant Python. Nustatykite tikslinį URL, išvesties PDF puslapio parinktis ir siųskite GET užklausą, kad gautumėte tinklalapio turinį. Įkelkite tinklalapio srautą į Document klasės objektą ir išsaugokite išvesties dokumentą kaip PDF.
Kodas, kaip paversti nuorodą į PDF dokumentą naudojant Python
# Import necessary modules | |
import requests # For making HTTP requests to fetch webpage content | |
from io import BytesIO # To handle byte stream data | |
from aspose.pdf import Document # Import Aspose PDF's Document class for PDF operations | |
import aspose.pdf as ap # Import Aspose PDF module for additional functionality | |
def fetch_web_content_as_stream(webpage_url): | |
""" | |
Fetches the content of a webpage and returns it as a byte stream. | |
Parameters: | |
webpage_url (str): The URL of the webpage to fetch. | |
Returns: | |
BytesIO: A byte stream of the webpage content. | |
""" | |
response = requests.get(webpage_url) # Send GET request to the specified URL | |
response.raise_for_status() # Raise an error if the request fails | |
return BytesIO(response.content) # Return the content as a byte stream | |
def main(): | |
""" | |
Main function that converts a webpage into a PDF document. | |
""" | |
# Set Aspose.PDF license (assumes "license.lic" file is available) | |
license = ap.License() | |
license.set_license("license.lic") | |
# Define the webpage URL to be converted | |
webpage_url = "https://docs.aspose.com/" | |
# Configure HTML-to-PDF conversion options | |
pdf_options = ap.HtmlLoadOptions(webpage_url) # Create HTML load options with the webpage URL | |
pdf_options.page_info.width = 1200 # Set PDF page width | |
pdf_options.page_info.height = 850 # Set PDF page height | |
# Fetch webpage content as a byte stream | |
with fetch_web_content_as_stream(webpage_url) as web_stream: | |
# Uncomment the lines below to print and inspect the webpage content | |
# print(web_stream.read().decode('utf-8', errors='ignore')) | |
# web_stream.seek(0) # Reset the stream position after reading | |
# Create a PDF document from the webpage stream | |
pdf_document = Document(web_stream, pdf_options) | |
# Save the converted PDF document | |
pdf_document.save("Converted_WebPage.pdf") | |
print("URL converted to PDF successfully") | |
# Run the main function if the script is executed directly | |
if __name__ == "__main__": | |
main() |
Šis kodas demonstruoja URL nuorodos konvertavimą į PDF naudojant Python. Nustatykite įspėjimų tvarkyklę, kad įgyvendintumėte atgalinio ryšio funkciją konvertavimo klaidoms, vėliavą, kad turinys būtų atvaizduojamas viename puslapyje, ir įvesties kodavimą. Galite perskaityti srautą ir jį atspausdinti, atkomentuodami dvi kodo eilutes, kad patikrintumėte tinklalapio turinį.
Šiame straipsnyje mes išmokome konvertuoti URL į PDF. Norėdami konvertuoti HTML turinį į PDF, kreipkitės į straipsnį kaip konvertuoti HTML į PDF naudojant Python.