आप इस संक्षिप्त ट्यूटोरियल के साथ C# में Word दस्तावेज़ से Text निकाल सकते हैं। इसमें विकास वातावरण स्थापित करने, चरण-दर-चरण वर्कफ़्लो और C#** में DOCX को TXT में परिवर्तित करने के लिए एक वर्तमान कार्यशील नमूना कोड शामिल है। विकसित एप्लिकेशन को Linux, MS Windows, या macOS में .NET फ्रेमवर्क का समर्थन करने वाले किसी भी एप्लिकेशन में एकीकृत किया जा सकता है।
C# में Word दस्तावेज़ से टेक्स्ट निकालने के चरण
- C# का उपयोग करके DOCX फ़ाइल को TXT फ़ाइल में बदलने के लिए Aspose.Words for .NET इंस्टॉल करके सिस्टम स्थापित करें
- Document वर्ग के उदाहरण का उपयोग करके स्रोत Word दस्तावेज़ तक पहुँचें
- TxtSaveOptions क्लास इंस्टेंस को इंस्टेंट करें और आवश्यक गुण सेट करें
- सेव विधि का उपयोग करके वर्ड फ़ाइल को डिस्क पर TXT के रूप में सहेजें
कुछ एपीआई कॉल का उपयोग करके सी# में वर्ड डॉक्यूमेंट से टेक्स्ट निकालें में ये संक्षिप्त चरण। सबसे पहले, डिस्क से स्रोत वर्ड दस्तावेज़ फ़ाइल को लोड करें, जिसके बाद TxtSaveOptions क्लास इंस्टेंस का उपयोग करके आउटपुट TXT फ़ाइल निर्यात विकल्प सेट करें। अंत में, लोड किए गए DOCX को सेव विधि का उपयोग करके डिस्क पर TXT फ़ाइल के रूप में सहेजा जाता है।
C# में DOCX को TXT में बदलने के लिए कोड
using Aspose.Words; | |
using Aspose.Words.Saving; | |
namespace Testword | |
{ | |
public class WordToText | |
{ | |
public static void ConvertWordToText() | |
{ | |
string FilePath = @"/Users/Documents/KnowledgeBase/TestData/"; | |
// Applying product license to extract text from Word document | |
License wordsLiense = new License(); | |
wordsLiense.SetLicense(FilePath + "Conholdate.Total.Product.Family.lic"); | |
// Load the Word file for text conversion | |
Document sourceWordDocx = new Document(FilePath + "Test1.docx"); | |
// Optional Text options | |
TxtSaveOptions txtOpts = new TxtSaveOptions(); | |
txtOpts.MaxCharactersPerLine = 100; | |
txtOpts.SaveFormat = SaveFormat.Text; | |
txtOpts.PrettyFormat = true; | |
sourceWordDocx.Save(FilePath + "ExtractedText.txt", txtOpts); | |
} | |
} | |
} |
वर्ड डॉक्यूमेंट से टेक्स्ट निकालने के लिए इस कोड स्निपेट में सी# आधारित एपीआई का प्रभावी ढंग से उपयोग किया गया है। आप वैकल्पिक TxtSaveOptions क्लास इंस्टेंस का उपयोग किए बिना Word दस्तावेज़ को TXT में सहेज सकते हैं। हालाँकि, यदि आपको आउटपुट TXT फ़ाइल को और अधिक अनुकूलित करना चाहिए, तो आप TxtSaveOptions वर्ग द्वारा उजागर किए गए विभिन्न गुणों का उपयोग कर सकते हैं जिनमें एन्कोडिंग, ForcePageBreaks, MaxCharactersPerLine, ParagraphBreak और PrettyFormat सेटिंग शामिल हैं।
इस आलेख में C#* का उपयोग करके *वर्ड से TXT कनवर्टर विकसित करने की जानकारी बताई गई है। यदि आप पीडीएफ दस्तावेज़ों की तुलना करना चाहते हैं, तो C# का उपयोग करके PDF दस्तावेज़ों की तुलना करें पर लेख देखें।