Jak przekonwertować plik PDF na plik tekstowy za pomocą C#

Ten podstawowy samouczek zawiera instrukcje dotyczące konwertowania pliku PDF na plik tekstowy przy użyciu języka C#, w tym ustawień konfiguracyjnych i fragmentu kodu, który można uruchomić. Pokazuje, jak za pomocą konwertera C# PDF to Text można utworzyć za pomocą kilku wywołań API. Wystarczy załadować dokument źródłowy PDF i zapisać plik wyjściowy Text.

Kroki, aby przekonwertować plik PDF na plik tekstowy za pomocą C#

  1. Dodaj odniesienie do Aspose.PDF for .NET do swojej aplikacji, aby przekonwertować plik PDF na plik tekstowy
  2. Załaduj źródłowy plik PDF, używając instancji klasy Document do utworzenia pliku tekstowego
  3. Utwórz instancję klasy TextAbsorber i wyodrębnij tekst ze wszystkich stron
  4. Zapisz wyjściowy plik tekstowy

Aby zapisać konfigurację aplikacji PDF to Text Converter w języku C# w środowisku .NET oraz procedurę krok po kroku, przedstawiono tutaj. Pierwszym krokiem jest szybka konfiguracja interfejsu API i załadowanie wejściowego pliku PDF. Następnie przystępujemy do wyodrębnienia tekstu ze wszystkich jego stron i zapisania wyodrębnionego tekstu do pliku lub strumienia zgodnie z wymaganiami.

Fragment kodu do konwersji plików PDF na tekst przy użyciu języka C#

Używając C# funkcji konwersji PDF na tekst, możesz zintegrować swoje aplikacje wraz z kontrolą nad odczytywaniem tekstu ze źródłowego pliku PDF, tak jak możesz czytać tekst ze wszystkich stron lub z określonej strony. Podobnie, jeśli chcesz czytać tekst z określonego obszaru prostokąta na stronie PDF, możesz również zdefiniować ten prostokątny obszar. Można również zdefiniować różne tryby konwersji plików PDF na tekst, takie jak Pure, Raw i MemorySaving.

W tym artykule dowiedzieliśmy się, jak kod PDF to Text C# może być używany w aplikacjach .NET. Jeśli jednak chcesz zapoznać się z konwersją dokumentów PDF na dokumenty HTML, zapoznaj się z artykułem na temat jak przekonwertować PDF na HTML za pomocą C#.

 Polski