Tento článek popisuje, jak odstranit obrázek z PDF pomocí Pythonu. Obsahuje informace pro nastavení IDE, seznam kroků k vývoji aplikace a ukázkový kód pro odstranění obrázku z PDF pomocí Pythonu. Naučíte se odstranit vybrané nebo všechny fotografie ze stránky v PDF.
Kroky k odstranění obrázku z PDF pomocí Pythonu
- Nastavte prostředí tak, aby k odstranění obrázků ze souboru PDF používalo Aspose.PDF pro Python přes .NET
- Otevřete soubor PDF pomocí třídy Document s obrázky
- Otevřete kolekci obrázků z vybrané stránky a zjistěte její počet
- Procházejte sbírku obrázků a odstraňte každý obrázek
- Save výstupní soubor PDF po smazání všech obrázků
Tyto kroky shrnují proces vývoje odstraňovače obrázků z PDF pomocí Pythonu. Načtěte soubor PDF do objektu třídy Document, zjistěte počet všech obrázků na vybrané stránce a spusťte smyčku v opačném směru počínaje posledním obrázkem k prvnímu obrázku v kolekci. Zavolejte metodu delete() pro každý obrázek a uložte konečný soubor PDF.
Kód pro odstranění všech obrázků z PDF pomocí Pythonu
import aspose.pdf as pdf | |
import io | |
# Load License | |
license = pdf.License() | |
license.set_license("License.lic") | |
# Open document | |
pdfDocument = pdf.Document("sample.pdf") | |
# Delete all images in the page | |
count = len(pdfDocument.pages[1].resources.images) | |
for i in range(count, 1, -1): | |
pdfDocument.pages[1].resources.images.delete(i) | |
# Save updated PDF file | |
pdfDocument.save("DeleteImages.pdf") | |
print("Image removed successfully") |
Tento kód ukazuje jak odstranit obrázek z PDF pomocí Pythonu. Tento proces však můžete opakovat pro všechny nebo vybrané stránky v PDF a smazat všechny obrázky z každé stránky. Stránky můžete filtrovat na základě různých artefaktů na stránce, jako je vodoznak, typ barvy nebo informace o stránce.
Tento článek nás naučil, jak odstranit všechny obrázky ze stránky v PDF. Pokud chcete přeškrtnout text v souboru PDF, přečtěte si článek na Jak vyškrtnout text v Adobe PDF pomocí Pythonu.