У цьому короткому посібнику описано, як читати таблицю PDF у C# і читати весь її вміст. Він містить детальний опис аналізу всіх таблиць у файлі PDF і подальшого доступу до кожного окремого рядка та комірки певної таблиці. Щоб читати таблицю з PDF-файлу C#, код складається з кількох рядків, за допомогою яких завантажується вихідний PDF-файл, а потім усі таблиці аналізуються для читання вмісту.
Кроки для читання таблиці PDF у C#
- Додайте посилання на Aspose.PDF for .NET, щоб читати дані таблиці в PDF
- Завантажте вихідний файл PDF за допомогою об’єкта класу Document
- Створіть об’єкт класу TableAbsorber і прочитайте всі таблиці з потрібної сторінки PDF
- Перегляньте всі рядки в цільовій таблиці PDF
- Перебирайте всі клітинки в кожному рядку та вибирайте всі фрагменти тексту
- Відображення або обробка кожного фрагмента тексту в комірці
У цих кроках використовується систематичний підхід до читання таблиці PDF у C#, де спочатку завантажується файл PDF, а потім усі таблиці аналізуються за допомогою об’єкта класу TableAbsorber. Після перегляду всіх таблиць у файлі PDF ви можете отримати посилання на будь-яку таблицю в проаналізованій колекції. Ви можете отримати доступ до будь-якої таблиці, рядка, комірки та текстового фрагмента у файлі PDF, щоб обробити або відобразити його.
Код для читання таблиці PDF у C#
У цьому прикладі коду використання C# parse PDF table стало можливим за допомогою класу TableAbsorber, який використовується для читання таблиць. Однак ви також можете використовувати інші параметри, такі як TextAbsorber, ParagraphAbsorber, FontAbsorber і TextFragmentAbsorber для доступу до різних елементів документа. Ви можете пройти через всю колекцію або отримати доступ до окремих елементів за допомогою індексу масиву.
У цій темі ми навчилися читати таблицю PDF на C#. Однак, якщо ви хочете читати закладки PDF, зверніться до статті як читати закладки в PDF за допомогою C#.