Ezzel a rövid oktatóanyaggal kibonthatja a(z) Text fájlt a Word dokumentumból C#-ban. Tartalmazza a fejlesztői környezet beállításának lépéseit, a lépésenkénti munkafolyamatot, valamint egy jelenlegi működő mintakódot a a DOCX TXT-re konvertálásához C#-ban. A kifejlesztett alkalmazás bármely Linux, MS Windows vagy macOS .NET keretrendszert támogató alkalmazásba integrálható.
Szöveg kibontásának lépései a Word dokumentumból C#-ban
- Állítsa be a rendszert a Aspose.Words for .NET telepítésével, hogy egy DOCX-fájlt TXT-fájllá konvertáljon C# használatával
- A forrás Word dokumentum elérése a Document osztály egy példányával
- Példányosítsa a TxtSaveOptions osztálypéldányt, és állítsa be a szükséges tulajdonságokat
- Mentse a Word fájlt TXT formátumban a lemezre a Mentés módszerrel
Ezek a tömör lépések a C#-ban néhány API-hívás segítségével kivonják a szöveget a Word-dokumentumból. Először töltse be a forrás Word dokumentumfájlt a lemezről, majd állítsa be a kimeneti TXT fájl exportálási beállításait a TxtSaveOptions osztálypéldány segítségével. Végül a betöltött DOCX TXT fájlként kerül mentésre a lemezre a Mentés módszerrel.
Kód a DOCX TXT-re konvertálásához C#-ban
using Aspose.Words; | |
using Aspose.Words.Saving; | |
namespace Testword | |
{ | |
public class WordToText | |
{ | |
public static void ConvertWordToText() | |
{ | |
string FilePath = @"/Users/Documents/KnowledgeBase/TestData/"; | |
// Applying product license to extract text from Word document | |
License wordsLiense = new License(); | |
wordsLiense.SetLicense(FilePath + "Conholdate.Total.Product.Family.lic"); | |
// Load the Word file for text conversion | |
Document sourceWordDocx = new Document(FilePath + "Test1.docx"); | |
// Optional Text options | |
TxtSaveOptions txtOpts = new TxtSaveOptions(); | |
txtOpts.MaxCharactersPerLine = 100; | |
txtOpts.SaveFormat = SaveFormat.Text; | |
txtOpts.PrettyFormat = true; | |
sourceWordDocx.Save(FilePath + "ExtractedText.txt", txtOpts); | |
} | |
} | |
} |
Ebben a kódrészletben hatékonyan alkalmazták a szöveg kivonását a Word dokumentumból C# alapú API-t. A Word-dokumentumot az opcionális TxtSaveOptions osztálypéldány használata nélkül mentheti TXT-be. Ha azonban tovább kellene testreszabnia a kimeneti TXT fájlt, használhatja a TxtSaveOptions osztály által közzétett különböző tulajdonságokat, beleértve a Kódolás, a ForcePageBreaks, a MaxCharactersPerLine, a ChapterBreak és a PrettyFormat beállítását, hogy csak néhányat említsünk.
Ez a cikk ismerteti a Word to TXT konverter C# használatával történő fejlesztéséhez szükséges információkat. Ha össze szeretné hasonlítani a PDF-dokumentumokat, olvassa el a(z) PDF dokumentumok összehasonlítása C# használatával cikket.