C#でPDFをHTMLに変換する方法

この簡単なハウツートピックでは、** C#でPDFHTMLに変換する方法に焦点を当てています。 Adobe Acrobatやその他のサードパーティツールに依存せずに、単純なAPI呼び出しを使用して、** PDFをC#**でHTMLにエクスポートできます。このアプリケーションは、MS Windows、Linux、またはmacOSオペレーティングシステムで実行されている.NETベースのアプリケーションのいずれかで使用できます。

C#でPDFをHTMLに変換する手順

  1. アプリケーションでNuGetパッケージツールを使用してAspose.PDFをインストールします
  2. アプリケーションにAspose.PDF名前空間への参照を追加します
  3. Documentクラスインスタンスを初期化して、PDFとそのHTMLへの変換をロードします
  4. HtmlSaveOptionsオブジェクトを初期化して、フォント、SVG、および画像の保存オプションを設定します
  5. 最後に、Saveメソッドを使用してC#でPDFをHTMLに変換します
  • C#PDFからHTML で上記の手順を実行することにより、単純なAPI呼び出しを使用して変換が可能になりました。まず、必要なAPI参照を追加してから、ソースPDFファイルをロードします。後で、 HtmlSaveOptions クラスを使用して、エクスポートされたHTMLに必要なオプションを設定します。最後に、Saveメソッド内で SaveFormat.Html *列挙子を使用することにより、HTMLがディスクに保存されます。

C#でPDFをHTMLに変換するコード

using System;
using Aspose.Pdf;
namespace TestPDF
{
public class PdfToHtmlConverter
{
public static void Main(string[] args)
{
// Applying product license to create HTML from PDF in C#
License PdfLic = new License();
PdfLic.SetLicense("PDF.Product.Family.lic");
// Initialize document object load the source PDF for exporting to HTML
Document document = new Document("SourcePDF.pdf");
// Initialize HTML SaveOptions to set export options
HtmlSaveOptions htmlSaveOptions = new HtmlSaveOptions();
// Split PDF to multiple HTML pages
htmlSaveOptions.SplitIntoPages = true;
htmlSaveOptions.FontSavingMode = HtmlSaveOptions.FontSavingModes.AlwaysSaveAsTTF;
// Managing SVG content
htmlSaveOptions.SpecialFolderForSvgImages = @"SvgSavePath";
// Managing Images inside PDF
htmlSaveOptions.SpecialFolderForAllImages = @"ImageSavePath";
// Create HTML from PDF using C#
document.Save("Generated_out.html",SaveFormat.Html);
}
}
}

上記のC#の例では、 HtmlSaveOptions クラスを使用してPDFをHTMLに変換します。これにより、PDFを複数のページに分割したり、フォント設定を管理したりするなどのオプションを設定できます。また、ソースPDFからエクスポートされた画像のパス設定に加えて、SVGコンテンツの圧縮やパスなどのSVGエクスポートオプションを設定することもできます。最後に、目的のHTMLファイルがディスクまたはMemoryStreamに保存され、さらに使用できるようになります。

  • PDFをC#でHTMLに変換*してカスタマイズされた出力を取得することがいかに便利であるかを目の当たりにしました。 PDFファイルを画像として保存することに興味がある場合は、C#でPDFを画像に変換する方法の記事を参照してください。
 日本語