このクイックチュートリアルでは、**JavaでPDFをHTMLに変換する方法を学習します。 Adobe Acrobatやその他のサードパーティツールに依存することなく、Windows、macOS、またはLinuxで実行する簡単な手順とコードを採用することで、PDFをJavaでHTMLに簡単に保存できます。
JavaでPDFをHTMLに変換する手順
- MavenリポジトリからAspose.PDF for Java参照を追加するようにプロジェクトを構成します
- プロジェクトにAspose.PDF名前空間への参照を追加します
- Document classオブジェクトをインスタンス化して、HTMLにエクスポートするためにPDFをロードします
- HtmlSaveOptionsオブジェクトを作成して、さまざまなHTMLオプションを設定します
- Saveメソッドを使用してJavaでPDFをHTMLに変換する
- PDFからHTMLへのコンバーターを開発するために、Javaベースのアプリケーションを使用することができます。プロセスは、APIリファレンスを含め、ディスクからソースPDFファイルをロードすることから始まります。以降の手順では、 HtmlSaveOptions クラスを使用して、必要なHTMLファイルのエクスポートオプションを設定します。最後に、生成されたHTMLは、SaveメソッドとSaveFormat.Html*列挙子を使用して保存されます。
PDFをJavaでHTMLに保存するコード
import com.aspose.pdf.Document; | |
import com.aspose.pdf.HtmlSaveOptions; | |
import com.aspose.pdf.HtmlSaveOptions.FontSavingModes; | |
import com.aspose.pdf.License; | |
import com.aspose.pdf.SaveFormat; | |
public class PdfToHtmlExport { | |
public static void Main(String[] args) throws Exception{ | |
// Applying product license to create HTML from PDF in Java | |
License pdfJavaLic = new License(); | |
pdfJavaLic.setLicense("PDF.Product.Family.lic"); | |
// Initialize document object load the source PDF for exporting to HTML | |
Document document = new Document("Test.pdf"); | |
// Initialize HTML SaveOptions to set export options | |
HtmlSaveOptions htmlSaveOptions = new HtmlSaveOptions(); | |
// Split multi HTML pages | |
htmlSaveOptions.setSplitIntoPages(true); | |
// Set Font saving mode | |
htmlSaveOptions.FontSavingMode = FontSavingModes.AlwaysSaveAsTTF; | |
// Managing SVG folders content | |
htmlSaveOptions.SpecialFolderForSvgImages = "\\SvgSavePath"; | |
// Managing Images folder inside PDF | |
htmlSaveOptions.SpecialFolderForAllImages = "\\ImageSavePath"; | |
// Using Java PDF to HTML export via Save method | |
document.save("Generated_out_Java.html",SaveFormat.Html); | |
} | |
} |
上記の例をJavaPDFからHTMLに使用することで、簡単に変換できます。 * HtmlSaveOptions *クラスを使用してHTML出力をカスタマイズしました。このクラスは、ソースPDFからエクスポートされた画像のパス設定とともに、圧縮やSVGコンテンツなどのSVGエクスポートオプションを設定するためのプロビジョニングを提供します。 PDFページを複数ページのHTML出力に分割するオプションとともに、エクスポートされたHTML内のフォントを管理することもできます。最後に、生成されたHTMLをディスクまたはMemoryStreamに保存して、さらに使用することができます。
上記の例では、カスタマイズされた出力を使用してJavaでPDFをHTMLに変換する方法を学習しました。プログラムでPDFを作成する場合は、Javaを使用してPDFを作成する方法の記事を参照してください。