Tento tutoriál popisuje, jak odstranit pozadí z PDF pomocí Pythonu. Obsahuje podrobnosti pro nastavení vývojového prostředí v linuxovém dockeru, sdílí seznam kroků pro psaní aplikace a spustitelný ukázkový kód pro odstranění obrázku na pozadí PDF pomocí Pythonu. Prozkoumáme také různé podtypy artefaktu, abychom je odstranili ze souboru PDF.
Kroky k odstranění pozadí PDF pomocí Pythonu
- Chcete-li odstranit pozadí, nastavte prostředí na použijte Aspose.PDF pro Python přes .NET
- Vložte soubor PDF do objektu Document s obrázkem na pozadí
- Přístup k cíli page z kolekce stránek v souboru PDF
- Analyzujte všechny artefakty v něm a zkontrolujte podtyp BACKGROUND
- Smažte artefakt, pokud splňuje podmínku
- Uložte výstupní soubor PDF
Tyto kroky rozvádějí proces vývoje odstraňovače pozadí z PDF pomocí Pythonu. Začněte proces přístupem k cílové stránce s obrázkem pozadí ze souboru PDF a analýzou kolekce na stránce. Před uložením výstupního souboru PDF zkontrolujte všechny artefakty typu BACKGROUND a odstraňte je.
Kód pro čištění pozadí PDF pomocí Pythonu
import aspose.pdf as pdf | |
import io | |
# Load License | |
license = pdf.License() | |
license.set_license("License.lic") | |
# Open the PDF file | |
doc = pdf.Document("BackGround.pdf") | |
# Access the first page | |
page = doc.pages[1] | |
# Iterate through all the artifacts | |
for fact in page.artifacts: | |
if fact.subtype == pdf.Artifact.ArtifactSubtype.BACKGROUND: | |
# Delete the background | |
page.artifacts.delete(fact) | |
# Save the output without background image | |
doc.save("withoutBackground.pdf") | |
print("Remove PDF background successfully") |
Tento kód ukazuje odstraňovač pozadí pro PDF pomocí Pythonu. Enumerátor Artifact.ArtifactSubtype obsahuje další možnosti, například WATERMARK, HEADER a FOOTER pro výběr a odstranění artefaktu, pokud je to nutné. Můžete iterovat všechny stránky souboru PDF a odstranit pozadí nebo jiné artefakty.
V tomto tématu jsme se naučili, jak odstranit pozadí z dokumentu PDF pomocí Pythonu. Pokud chcete odstranit omezení ze souboru PDF, přečtěte si článek na jak odstranit omezení pro dokument PDF v Pythonu.