Ten temat zawiera szczegółowe informacje na temat pobierania obrazów z pliku PDF w języku Python za pomocą kroków konfiguracyjnych i przykładowego kodu, który można uruchomić. Udostępniany jest kompletny kod programu, który można wykorzystać do opracowania tej aplikacji, ponieważ dostępne są wszystkie wymagane klasy i metody, które są potrzebne do pobrania obrazów z pliku PDF w Pythonie w różnych formatach, takich jak PNG, JPEG itp. Zobaczysz również różne opcje usprawnienia procesu poprzez dostosowanie generowanych obrazów po uzyskaniu dostępu do nich z pliku PDF.
Kroki, aby uzyskać obrazy PDF w Pythonie
- Skonfiguruj IDE, aby używało Aspose.PDF dla Pythona przez .NET do wyodrębniania obrazów z pliku PDF
- Uzyskaj dostęp do źródłowego pliku PDF zawierającego obrazy za pomocą obiektu klasy Document
- Uzyskaj dostęp do określonego obrazu w zasobach strony za pomocą obiektu klasy XImage
- Wygeneruj nowy strumień plików, używając nazwy żądanego obrazu
- Zapisz obraz jako plik JPEG na dysku
Te kroki obejmują jak uzyskać obraz z pliku PDF w Pythonie, ujawniając podejście krok po kroku, w którym najpierw otwieramy źródłowy plik PDF, a następnie uzyskujemy dostęp do określonej strony w pliku PDF. Dla każdej strony PDF istnieje zbiór zasobów, w tym obrazów, do których można się odwoływać za pomocą indeksu. Po uzyskaniu dostępu do wymaganego odniesienia do obrazu przy użyciu instancji obiektu klasy XImage, można ją zapisać jako obraz na dysku przy użyciu instancji strumienia pamięci.
Kod do pobierania obrazu z pliku PDF w Pythonie
Ten kod przedstawia procedurę uzyskania obrazu z pliku PDF w Pythonie poprzez dostęp do niego do obiektu klasy Document, a następnie załadowanie dostępu do żądanego obrazu na określonej stronie poprzez dostęp do listy zasobów Po uzyskaniu dostępu do żądanego obrazu możemy może zmienić jego nazwę, a także dokonać zmian w odniesieniach w dokumencie. Możesz także uzyskać dostęp do różnych właściwości, takich jak nazwa, szerokość i wysokość, aby filtrować obrazy przed zapisaniem ich jako pliku na dysku.
Ten przykład poprowadził nas do wyodrębnienia obrazów ze strony PDF. Jeśli chcesz dowiedzieć się więcej o procesie dodawania znaku wodnego w pliku PDF, zapoznaj się z artykułem na stronie jak dodać znak wodny do pliku PDF w Pythonie.