Ten podstawowy samouczek zawiera instrukcje dotyczące konwertowania pliku PDF na plik tekstowy przy użyciu języka C#, w tym ustawień konfiguracyjnych i fragmentu kodu, który można uruchomić. Pokazuje, jak za pomocą konwertera C# PDF to Text można utworzyć za pomocą kilku wywołań API. Wystarczy załadować dokument źródłowy PDF i zapisać plik wyjściowy Text.
Kroki, aby przekonwertować plik PDF na plik tekstowy za pomocą C#
- Dodaj odniesienie do Aspose.PDF for .NET do swojej aplikacji, aby przekonwertować plik PDF na plik tekstowy
- Załaduj źródłowy plik PDF, używając instancji klasy Document do utworzenia pliku tekstowego
- Utwórz instancję klasy TextAbsorber i wyodrębnij tekst ze wszystkich stron
- Zapisz wyjściowy plik tekstowy
Aby zapisać konfigurację aplikacji PDF to Text Converter w języku C# w środowisku .NET oraz procedurę krok po kroku, przedstawiono tutaj. Pierwszym krokiem jest szybka konfiguracja interfejsu API i załadowanie wejściowego pliku PDF. Następnie przystępujemy do wyodrębnienia tekstu ze wszystkich jego stron i zapisania wyodrębnionego tekstu do pliku lub strumienia zgodnie z wymaganiami.
Fragment kodu do konwersji plików PDF na tekst przy użyciu języka C#
Używając C# funkcji konwersji PDF na tekst, możesz zintegrować swoje aplikacje wraz z kontrolą nad odczytywaniem tekstu ze źródłowego pliku PDF, tak jak możesz czytać tekst ze wszystkich stron lub z określonej strony. Podobnie, jeśli chcesz czytać tekst z określonego obszaru prostokąta na stronie PDF, możesz również zdefiniować ten prostokątny obszar. Można również zdefiniować różne tryby konwersji plików PDF na tekst, takie jak Pure, Raw i MemorySaving.
W tym artykule dowiedzieliśmy się, jak kod PDF to Text C# może być używany w aplikacjach .NET. Jeśli jednak chcesz zapoznać się z konwersją dokumentów PDF na dokumenty HTML, zapoznaj się z artykułem na temat jak przekonwertować PDF na HTML za pomocą C#.