Das programmgesteuerte Lesen verschiedener Arten von Dokumenten ist heutzutage gängige Praxis. In dieser Anleitung erfahren Sie, wie Sie die PDF-Datei in C# lesen, indem Sie die folgenden einfachen Schritte befolgen.

Schritte zum Lesen von PDF-Dateien in C#

Erstellen Sie in Visual Studio eine leere C#-Konsolenanwendung
Fügen Sie einen Verweis auf Aspose.PDF for .NET hinzu, indem Sie es von NuGet.org installieren
Laden Sie eine vorhandene PDF-Datei in das Document-Objekt
Initialisieren Sie die Klasse TextAbsorber, um die PDF-Datei zu lesen
Extrahieren Sie PDF-Text und schreiben Sie ihn in die Konsolenausgabe
Durchlaufen Sie die PDF-Seite Resources, um Bilder zu finden
FileStream-Objekt mit gefundenem Bild erstellen
Speichern Sie das Image auf der lokalen Festplatte

Das folgende Code-Snippet erklärt, wie man PDF-Dateien in C# öffnet und liest. Sie können Text lesen und Bilder aus einer PDF-Datei extrahieren, indem Sie sie verwenden. Die API bietet eine TextAbsorber-Klasse, die zum Lesen von Text aus einer PDF-Datei verwendet wird, und Sie können die extrahierten Ergebnisse über das Text-Objekt erzielen. Das Suchen und Speichern von Bildern auf der lokalen Festplatte ist auch möglich, indem Sie die PDF-Seitenressourcen wie unten gezeigt durchlaufen.

Code zum Lesen von PDF-Dateien in C#

Im vorherigen Thema haben Sie wie man große PDF-Dateien in C# verarbeitet gelernt. Mit den obigen Informationen und dem Codebeispiel können Sie PDF-Dateien in C# öffnen und lesen, um Text und Bilder zu extrahieren.

Aspose Wissensbasis

Finden Sie Antworten nach API

So lesen Sie PDF-Dateien in C#

Schritte zum Lesen von PDF-Dateien in C#

Code zum Lesen von PDF-Dateien in C#