Estrai testo da un documento Word in C#

Puoi Estrai Text dal documento Word in C# con questo breve tutorial. Comprende i passaggi per la configurazione dell’ambiente di sviluppo, il flusso di lavoro passo passo e un codice di esempio funzionante per convertire DOCX in TXT in C#. L’applicazione sviluppata può essere integrata in qualsiasi applicazione che supporti il framework .NET in Linux, MS Windows o macOS.

Passaggi per estrarre testo da un documento Word in C#

  1. Stabilisci il sistema installando Aspose.Words for .NET per convertire un file DOCX in un file TXT utilizzando C#
  2. Accedi al documento Word di origine utilizzando un’istanza della classe Document
  3. Crea un’istanza dell’istanza della classe TxtSaveOptions e imposta le proprietà richieste
  4. Salva il file Word come TXT sul disco utilizzando il metodo Salva

Questi passaggi concisi in C# estraggono il testo da un documento Word utilizzando alcune chiamate API. Innanzitutto, carica il file del documento Word di origine dal disco, quindi imposta le opzioni di esportazione del file TXT di output utilizzando l’istanza della classe TxtSaveOptions. Infine, il DOCX caricato viene salvato come file TXT sul disco utilizzando il metodo Save.

Codice per convertire DOCX in TXT in C#

Per estrarre il testo dal documento Word, l’API basata su C# è stata utilizzata in modo efficace in questo frammento di codice. È possibile salvare il documento Word in TXT senza utilizzare l’istanza facoltativa della classe TxtSaveOptions. Tuttavia, se desideri personalizzare ulteriormente il file TXT di output, puoi utilizzare diverse proprietà esposte dalla classe TxtSaveOptions inclusa l’impostazione Encoding, ForcePageBreaks, MaxCharactersPerLine, ParagraphBreak e PrettyFormat per citarne alcuni.

Questo articolo ha spiegato le informazioni per sviluppare un convertitore da Word a TXT utilizzando C#. Se desideri confrontare i documenti PDF, fai riferimento all’articolo su Confronta documenti PDF utilizzando C#.

 Italiano