C#を使用してPDFをテキストファイルに変換する方法

この基本的なチュートリアルでは、構成設定や実行可能なコードスニペットなど、** C#を使用してPDFをテキストファイルに変換する方法について説明します。これは、 C#PDFからテキスト**へのコンバーターの使用をいくつかのAPI呼び出しで作成する方法を示しています。ソースPDFドキュメントをロードし、出力Textファイルを保存するだけです。

C#を使用してPDFをテキストファイルに変換する手順

  1. Aspose.PDF for .NETへの参照をアプリケーションに追加して、PDFをテキストファイルに変換します
  2. テキストファイルを作成するためのDocumentクラスインスタンスを使用してソースPDFファイルをロードします
  3. TextAbsorberクラスのインスタンスを作成し、すべてのページからテキストを抽出します
  4. 出力テキストファイルを保存します

.NETFrameworkで*PDFからテキストへのコンバーターC#*ベースのアプリケーション構成を作成するためのステップバイステップの手順をここに示します。最初のステップとして、APIをすばやく構成し、入力PDFファイルをロードします。次に、すべてのページからテキストを抽出し、必要に応じて抽出したテキストをファイルまたはストリームに書き込みます。

C#を使用してPDFをテキストに変換するコードスニペット

  • C#を使用してPDFをテキストに変換*機能をアプリケーションに統合し、すべてのページまたは指定したページからテキストを読み取ることができるように、ソースPDFからのテキストの読み取りを制御できます。同様に、PDFページの特定の長方形の領域からテキストを読みたい場合は、その長方形の領域も自由に定義できます。 PDFをPure、Raw、MemorySavingなどのテキストに変換するためのさまざまなモードを定義することもできます。

この記事では、.NETアプリケーションで* PDF to Text C#*コードを使用する方法を学びました。ただし、PDFからHTMLドキュメントへの変換について詳しく知りたい場合は、C#を使用してPDFをHTMLに変換する方法の記事を参照してください。

 日本語