Dieses grundlegende Tutorial führt Sie durch das Konvertieren von PDF-Dateien in Textdateien mit C#, einschließlich der Konfigurationseinstellungen und eines ausführbaren Code-Snippets. Es zeigt, wie mit ein paar API-Aufrufen ein C#-PDF-zu-Text-Konverter erstellt werden kann. Sie müssen nur das Quelldokument PDF laden und die Ausgabedatei Text speichern.
Schritte zum Konvertieren von PDF in eine Textdatei mit C#
- Fügen Sie Ihrer Anwendung einen Verweis auf Aspose.PDF for .NET hinzu, um PDF in eine Textdatei zu konvertieren
- Laden Sie die PDF-Quelldatei mithilfe der Document-Klasseninstanz zum Erstellen einer Textdatei
- Erstellen Sie eine Instanz der Klasse TextAbsorber und extrahieren Sie Text aus allen Seiten
- Speichern Sie die ausgegebene Textdatei
Zum Schreiben von PDF to Text Converter C#-basierter Anwendungskonfiguration im .NET-Framework und eine Schritt-für-Schritt-Anleitung finden Sie hier. Konfigurieren Sie als ersten Schritt schnell die API und laden Sie die PDF-Eingabedatei. Als nächstes extrahieren wir den Text aus allen Seiten und schreiben den extrahierten Text gemäß den Anforderungen in eine Datei oder einen Stream.
Codeausschnitt zum Konvertieren von PDF in Text mit C#
Mit der Funktion C# PDF in Text konvertieren kann die Funktion in Ihre Anwendungen integriert werden, zusammen mit der Kontrolle über das Lesen von Text aus der Quell-PDF, als ob Sie Text von allen Seiten oder von einer bestimmten Seite lesen könnten. Wenn Sie Text aus einem bestimmten rechteckigen Bereich auf der PDF-Seite lesen möchten, haben Sie ebenfalls die Freiheit, diesen rechteckigen Bereich ebenfalls zu definieren. Es können auch verschiedene Modi zum Konvertieren von PDF in Text wie Pure, Raw und MemorySaving definiert werden.
In diesem Artikel haben wir gelernt, wie PDF to Text C#-Code in Ihren .NET-Anwendungen verwendet werden kann. Wenn Sie jedoch mehr über die Konvertierung von PDF- in HTML-Dokumente erfahren möchten, lesen Sie den Artikel zu Wie konvertiert man PDF in HTML mit C#.