Эта простая тема посвящена тому, как преобразовать HTML в текст в Java. Приложение преобразования Java HTML в обычный текст, работающее под платформами Windows, Linux или macOS, может быть разработано с использованием простых и удобных API-интерфейсов.

Шаги для преобразования HTML в текст в Java

Настройте свой проект, чтобы добавить Aspose.HTML for Java из репозитория Maven.
Включите ссылку на пространство имен Aspose.HTML в свое приложение.
Прочитайте содержимое исходного файла HMTL, используя объект String.
Инициализировать объект HTMLDocument class для загрузки исходной строки HTML.
Инициализировать объект класса INodeIterator для итерации узлов и добавления в StringBuilder.
Сохраните извлеченный текст из HTML на диске

Чтобы извлечь текст из HTML, можно использовать приложение на основе Java, используя несколько строк кода. Мы начнем процесс, загрузив исходный HTML-код в объект String, а затем загрузив эту строку с помощью класса HTMLDocument. Затем мы будем использовать INodeIterator для извлечения, обхода и добавления узлов HMTL в StringBuilder. Наконец, StringBuilder будет сохранен как обычный текстовый файл на диске.

Код для преобразования HTML в текст в Java

Приведенный выше пример в Java конвертирует HTML в обычный текст за несколько вызовов API. Мы создали класс StyleFilter, который расширяет класс NodeFilter и реализует метод AcceptNode для установки фильтров узлов клиента и исключения нежелательных узлов из HTML в процессе преобразования.

В этом разделе мы рассмотрели как извлечь текст из HTML в Java. Если вас интересует преобразование файла MD в формат XPS, перейдите к разделу конвертировать Markdown в XPS с помощью Java.

Aspose База знаний

Найдите ответы API

Как преобразовать HTML в текст в Java

Шаги для преобразования HTML в текст в Java

Код для преобразования HTML в текст в Java