本教程介绍如何使用 Python 从 PDF 中删除背景。它包含在 Linux docker 映像中设置开发环境的详细信息,共享编写应用程序的步骤列表,以及使用 Python 删除 PDF 背景图像的可运行示例代码。我们还将探索工件的不同子类型,以将其从 PDF 文件中删除。
使用 Python 删除 PDF 背景的步骤
- 将环境设置为通过 .NET 使用 Aspose.PDF for Python以删除背景
- 将 PDF 文件加载到其中包含背景图像的 Document 对象中
- 从 PDF 文件中的页面集合访问目标 page
- 解析其中的所有工件并检查子类型BACKGROUND
- 如果满足条件则删除工件
- 保存输出的 PDF 文件
这些步骤详细说明了使用 Python* 开发 PDF 背景去除器的过程。通过使用 PDF 文件中的背景图像访问目标页面来启动该过程,并解析页面上的集合。检查所有背景类型工件并在保存输出 PDF 文件之前将其删除。
使用 Python 清理 PDF 背景的代码
import aspose.pdf as pdf | |
import io | |
# Load License | |
license = pdf.License() | |
license.set_license("License.lic") | |
# Open the PDF file | |
doc = pdf.Document("BackGround.pdf") | |
# Access the first page | |
page = doc.pages[1] | |
# Iterate through all the artifacts | |
for fact in page.artifacts: | |
if fact.subtype == pdf.Artifact.ArtifactSubtype.BACKGROUND: | |
# Delete the background | |
page.artifacts.delete(fact) | |
# Save the output without background image | |
doc.save("withoutBackground.pdf") | |
print("Remove PDF background successfully") |
此代码演示了 使用 Python 的 PDF 背景去除器。枚举器 Artifact.ArtifactSubtype 包含其他选项,如 WATERMARK、HEADER 和 FOOTER,用于根据需要选择和删除工件。您可以遍历 PDF 文件的所有页面并删除背景或其他伪影。
在本主题中,我们学习了如何使用 Python*从 PDF 文档中删除背景。如果您想删除 PDF 文件的限制,请参阅 如何在Python中删除PDF文档的限制 上的文章。