Como converter PDF para HTML em C#

Este breve tópico de instruções se concentra em como Converter PDF em HTML em C#. Você pode exportar PDF para HTML em C# usando chamadas de API simples sem depender do Adobe Acrobat ou de qualquer outra ferramenta de terceiros. Este aplicativo pode ser usado em qualquer um dos aplicativos baseados em .NET executados em sistemas operacionais MS Windows, Linux ou macOS.

Etapas para converter PDF em HTML em C#

  1. Instale Aspose.PDF usando a ferramenta de pacote NuGet em seu aplicativo
  2. Adicione uma referência ao namespace Aspose.PDF em seu aplicativo
  3. Inicialize a instância da classe Document para carregar o PDF e sua conversão para HTML
  4. Inicialize o objeto HtmlSaveOptions para definir as opções de fontes, SVG e salvar imagens
  5. Finalmente, converta PDF para HTML em C# usando o método Save

Ao seguir as etapas acima na conversão de C# PDF para HTML foi possível usando chamadas de API simples. Você começará adicionando as referências de API necessárias e, em seguida, carregando o arquivo PDF de origem. Posteriormente, você definirá as opções necessárias no HTML exportado usando a classe HtmlSaveOptions. Finalmente, usando o enumerador SaveFormat.Html dentro do método Save, o HTML será salvo no disco.

Código para converter PDF em HTML em C#

O exemplo acima em C# converte PDF para HTML usando a classe HtmlSaveOptions que permitirá que você defina as opções como dividir PDF em várias páginas e gerenciar configurações de fonte. Ele também permite que você defina as opções de exportação SVG, como compactação e caminho para conteúdo SVG, juntamente com configurações de caminho para imagens exportadas do PDF de origem. Finalmente, o arquivo HTML desejado é salvo em disco ou em um MemoryStream para uso posterior.

Nós testemunhamos como é conveniente converter PDF para HTML em C# e obter uma saída personalizada. Se você estiver interessado em salvar arquivos PDF como imagens, consulte o artigo em como converter PDF para imagem em C#.

 Português