Szöveg kibontása Word dokumentumból C#-ban

Ezzel a rövid oktatóanyaggal kibonthatja a(z) Text fájlt a Word dokumentumból C#-ban. Tartalmazza a fejlesztői környezet beállításának lépéseit, a lépésenkénti munkafolyamatot, valamint egy jelenlegi működő mintakódot a a DOCX TXT-re konvertálásához C#-ban. A kifejlesztett alkalmazás bármely Linux, MS Windows vagy macOS .NET keretrendszert támogató alkalmazásba integrálható.

Szöveg kibontásának lépései a Word dokumentumból C#-ban

  1. Állítsa be a rendszert a Aspose.Words for .NET telepítésével, hogy egy DOCX-fájlt TXT-fájllá konvertáljon C# használatával
  2. A forrás Word dokumentum elérése a Document osztály egy példányával
  3. Példányosítsa a TxtSaveOptions osztálypéldányt, és állítsa be a szükséges tulajdonságokat
  4. Mentse a Word fájlt TXT formátumban a lemezre a Mentés módszerrel

Ezek a tömör lépések a C#-ban néhány API-hívás segítségével kivonják a szöveget a Word-dokumentumból. Először töltse be a forrás Word dokumentumfájlt a lemezről, majd állítsa be a kimeneti TXT fájl exportálási beállításait a TxtSaveOptions osztálypéldány segítségével. Végül a betöltött DOCX TXT fájlként kerül mentésre a lemezre a Mentés módszerrel.

Kód a DOCX TXT-re konvertálásához C#-ban

using Aspose.Words;
using Aspose.Words.Saving;
namespace Testword
{
public class WordToText
{
public static void ConvertWordToText()
{
string FilePath = @"/Users/Documents/KnowledgeBase/TestData/";
// Applying product license to extract text from Word document
License wordsLiense = new License();
wordsLiense.SetLicense(FilePath + "Conholdate.Total.Product.Family.lic");
// Load the Word file for text conversion
Document sourceWordDocx = new Document(FilePath + "Test1.docx");
// Optional Text options
TxtSaveOptions txtOpts = new TxtSaveOptions();
txtOpts.MaxCharactersPerLine = 100;
txtOpts.SaveFormat = SaveFormat.Text;
txtOpts.PrettyFormat = true;
sourceWordDocx.Save(FilePath + "ExtractedText.txt", txtOpts);
}
}
}

Ebben a kódrészletben hatékonyan alkalmazták a szöveg kivonását a Word dokumentumból C# alapú API-t. A Word-dokumentumot az opcionális TxtSaveOptions osztálypéldány használata nélkül mentheti TXT-be. Ha azonban tovább kellene testreszabnia a kimeneti TXT fájlt, használhatja a TxtSaveOptions osztály által közzétett különböző tulajdonságokat, beleértve a Kódolás, a ForcePageBreaks, a MaxCharactersPerLine, a ChapterBreak és a PrettyFormat beállítását, hogy csak néhányat említsünk.

Ez a cikk ismerteti a Word to TXT konverter C# használatával történő fejlesztéséhez szükséges információkat. Ha össze szeretné hasonlítani a PDF-dokumentumokat, olvassa el a(z) PDF dokumentumok összehasonlítása C# használatával cikket.

 Magyar