Как преобразовать PDF в текстовый файл с помощью C#

В этом базовом учебном пособии вы узнаете, как преобразовать PDF в текстовый файл с помощью C#, включая параметры конфигурации и фрагмент исполняемого кода. Он демонстрирует, как можно создать конвертер C# PDF в текст с помощью нескольких вызовов API. Вам нужно только загрузить исходный документ PDF и сохранить выходной файл Text.

Действия по преобразованию PDF в текстовый файл с помощью C#

  1. Добавьте ссылку на Aspose.PDF for .NET в свое приложение, чтобы преобразовать PDF в текстовый файл.
  2. Загрузите исходный файл PDF, используя экземпляр класса Document для создания текстового файла.
  3. Создайте экземпляр класса TextAbsorber и извлеките текст со всех страниц.
  4. Сохраните выходной текстовый файл

Для написания конвертера PDF в текст C# конфигурация приложения на основе .NET Framework и пошаговая процедура приведены здесь. В качестве первого шага быстро настройте API и загрузите входной PDF-файл. Затем мы приступаем к извлечению текста со всех его страниц и записи извлеченного текста в файл или поток в соответствии с требованиями.

Фрагмент кода для преобразования PDF в текст с помощью С#

Использование функции C# преобразования PDF в текст* может быть интегрировано в ваши приложения вместе с контролем над чтением текста из исходного PDF-файла, например, вы можете читать текст со всех страниц или с указанной страницы. Точно так же, если вы хотите прочитать текст из определенной прямоугольной области на странице PDF, вы также можете определить эту прямоугольную область. Различные режимы также могут быть определены для преобразования PDF в текст, такие как Pure, Raw и MemorySaving.

В этой статье мы узнали, как код PDF to Text C# можно использовать в ваших приложениях .NET. Однако, если вы хотите изучить преобразование документов PDF в HTML, обратитесь к статье как конвертировать PDF в HTML с помощью С#.

 Русский