Como converter Word para Markdown usando Java

Neste breve tutorial, aprenderemos como converter Word para Markdown usando Java. Os arquivos Markdown são usados popularmente para criar páginas da Web e artigos pela Internet. Você pode criar um documento como um arquivo DOC ou DOCX e exportá-lo com o conversor Word to Markdown usando Java em qualquer sistema operacional como MS Windows, macOS ou Linux.

Etapas para converter Word em Markdown usando Java

  1. Adicione referência ao arquivo JAR Aspose.Words usando o repositório Maven
  2. Instancie o objeto de classe Document para carregar o documento de origem
  3. Usando a classe MarkdownSaveOptions, defina propriedades diferentes para o arquivo markdown
  4. Salve o arquivo de saída gerado no formato markdown

Nas etapas acima, o documento do Word de entrada é carregado primeiro e, em seguida, diferentes propriedades expostas pela classe MarkdownSaveOptions são definidas. Por exemplo, você pode especificar preferências para o arquivo markdown como codificação, otimização de memória ou o rodapé do cabeçalho etc. Por meio desse processo, você pode converter facilmente DOCX para MD usando Java.

Código para converter DOCX para Markdown usando Java

import com.aspose.words.Document;
import com.aspose.words.License;
import com.aspose.words.MarkdownSaveOptions;
public class ConvertWordToMarkdown {
public static void main(String[] args) throws Exception { // main method for converting word to markdown
//Set license before converting word to markdown
License WordToMarkdownInJavaLicense = new License();
WordToMarkdownInJavaLicense.setLicense("License.lic");
// Load the input DOCX document with the Document class
Document doc = new Document("Input.docx");
// Initialize MarkdownSaveOptions object
MarkdownSaveOptions options = new MarkdownSaveOptions();
options.setUpdateFields(true);
options.setMemoryOptimization(true);
// Save the input word DOCX file to Markdown format
doc.save("SaveWordToMarkdown.md", options);
}
}

Neste trecho de código, um objeto de classe Documento é inicializado para carregar o documento do Word de origem. Características diferentes para o arquivo de saída também são definidas para que a codificação, os cabeçalhos e os rodapés sejam especificados para obter o arquivo de remarcação necessário. Você pode usar esse recurso para converter DOCX em Markdown usando Java em seu aplicativo.

Neste artigo, aprendemos como converter DOC em MD usando Java. No entanto, se você estiver interessado em explorar a conversão de Word para HTML, consulte o artigo em como converter DOCX para HTML usando Java.

 Português