Jak czytać tabelę PDF w C#

Ten krótki samouczek pokazuje jak czytać tabelę PDF w C# i czytać całą jej zawartość. Zawiera szczegółowy opis analizowania wszystkich tabel w pliku PDF, a następnie uzyskiwania dostępu do każdego pojedynczego wiersza i komórki określonej tabeli. Aby odczytać tabelę z PDF, kod C# składa się z kilku linii, w których ładowany jest źródłowy plik PDF, a następnie wszystkie tabele są analizowane w celu odczytania zawartości.

Kroki, aby przeczytać tabelę PDF w C#

  1. Dodaj odwołanie do Aspose.PDF for .NET, aby odczytać dane z tabeli w pliku PDF
  2. Załaduj źródłowy plik PDF za pomocą obiektu klasy Document
  3. Utwórz instancję obiektu klasy TableAbsorber i przeczytaj wszystkie tabele z żądanej strony PDF
  4. Iteruj przez wszystkie wiersze w docelowej tabeli PDF
  5. Iteruj wszystkie komórki w każdym wierszu i pobierz wszystkie fragmenty tekstu
  6. Wyświetlaj lub przetwarzaj każdy fragment tekstu w komórce

W tych krokach stosuje się systematyczne podejście do czytania tabeli PDF w języku C#, gdzie początkowo ładowany jest plik PDF, a następnie wszystkie tabele są analizowane przy użyciu obiektu klasy TableAbsorber. Po odwiedzeniu wszystkich tabel w pliku PDF można uzyskać odniesienie do dowolnej tabeli w przeanalizowanej kolekcji. Możesz uzyskać dostęp do dowolnej tabeli, wiersza, komórki i fragmentu tekstu w pliku PDF, aby je przetworzyć lub wyświetlić.

Kod do odczytu tabeli PDF w C#

W tym przykładowym kodzie użycie C# parse PDF table jest możliwe dzięki klasie TableAbsorber, która jest używana do odczytywania tabel. Możesz jednak również użyć innych opcji, takich jak TextAbsorber, ParagraphAbsorber, FontAbsorber i TextFragmentAbsorber, aby uzyskać dostęp do różnych elementów dokumentu. Możesz przeglądać całą kolekcję lub uzyskiwać dostęp do poszczególnych elementów za pomocą indeksu tablicy.

Nauczyliśmy się czytać tabelę PDF w C# w tym temacie. Jeśli jednak chcesz przeczytać zakładki PDF, zapoznaj się z artykułem na jak czytać zakładki w PDF przy użyciu C#.

 Polski