Този кратък урок предоставя подробности за това как да конвертирате PDF в текст в Java чрез зареждане на входния PDF документ и записването му във формат Text. Освен това използването на Java PDF to Text converter може да бъде персонализирано, за да контролира дали искате изходния текст със или без форматиране в сравнение с изходния PDF файл.
Стъпки за конвертиране на PDF в текст в Java
- Конфигурирайте приложението си, като добавите препратка към Aspose.PDF от хранилището на Maven, за да конвертирате PDF в текстов файл
- Заредете входния PDF файл с обекта от клас Document за преобразуване на PDF в текстов файл
- Създайте обект от клас TextAbsorber, за да зададете опциите за извличане на текст
- Запишете извлечения текст в текстов файл
Стъпките по-горе разработват процеса на разработване на PDF към Text Java базирано конверторно приложение. В първата стъпка входният PDF документ се зарежда с помощта на екземпляра на класа на документа и след това изберете дали искате текстът да бъде форматиран или не. И накрая, можете да използвате текстовия низ, за да запишете във файл или да го обработите допълнително според вашите изисквания.
Код за конвертиране на PDF в текст в Java
Този примерен код демонстрира, че с помощта на Java преобразува PDF в текст с пълен контрол чрез използване на различни опции, като класа TextAbsorber, има множество конструктори, където можете да използвате TextSearchOptions, който предоставя опцията за преобразуване на защрихования текст в изходния PDF като отделен текст. По същия начин можете да зададете флагове за търсене на текст само в обвързаната страница или да зададете правоъгълник за търсене на текста от определена област само във всички страници.
Тук научихме как да конвертираме PDF в текст в Java заедно с кодовия фрагмент. Ако искате да научите процеса на конвертиране на PDF в Word, вижте статията на как да конвертирате PDF в Word в Java.