Як перетворити PDF на текстовий файл за допомогою C#

У цьому базовому посібнику описано, як конвертувати PDF-файл у текстовий файл за допомогою C#, включаючи параметри конфігурації та фрагмент коду, який можна виконувати. Він демонструє, як за допомогою конвертера C# PDF to Text можна створити за допомогою кількох викликів API. Вам потрібно лише завантажити вихідний документ PDF і зберегти вихідний файл Text.

Кроки для перетворення PDF у текстовий файл за допомогою C#

  1. Додайте посилання на Aspose.PDF for .NET у свою програму, щоб конвертувати PDF у текстовий файл
  2. Завантажте вихідний PDF-файл за допомогою екземпляра класу Document для створення текстового файлу
  3. Створіть екземпляр класу TextAbsorber і витягніть текст з усіх сторінок
  4. Збережіть вихідний текстовий файл

Для написання конфігурації програми PDF to Text Converter C# у платформі .NET і покрокової процедури наведено тут. Як перший крок, швидко налаштуйте API та завантажте вхідний PDF-файл. Далі ми переходимо до вилучення тексту з усіх сторінок і записуємо витягнутий текст у файл або потік відповідно до вимог.

Фрагмент коду для перетворення PDF на текст за допомогою C#

За допомогою C# функції конвертації PDF у текст можна інтегрувати у ваші програми разом із керуванням читанням тексту з вихідного PDF-файлу, як ви можете читати текст з усіх сторінок або з певної сторінки. Подібним чином, якщо ви хочете прочитати текст із певної прямокутної області на сторінці PDF, ви також маєте право визначити цю прямокутну область. Також можна визначити різні режими для перетворення PDF у текст, наприклад Pure, Raw і MemorySaving.

У цій статті ми дізналися, як код PDF to Text C# можна використовувати у ваших програмах .NET. Однак, якщо ви хочете дослідити перетворення документів PDF у HTML, зверніться до статті як конвертувати PDF у HTML за допомогою C#.

 Українська