Ebben a rövid oktatóanyagban megtanuljuk, hogyan kell Word-dokumentumot olvasni C#-ban a környezetkonfiguráció részleteivel, a lépések listájával és a futtatható kóddal. A kód különböző módokon mutatja be a Word-fájl olvasását. Megtanulhatja, hogyan olvassa el a C# a Word-dokumentumot, ha betölt egy Word-fájlt, például DOCX, DOC, RTF- vagy HTML-fájlt stb., majd hozzáfér a különböző elemeihez feldolgozáshoz vagy megtekintéshez.
Lépések az adatok kiolvasásához Word-dokumentumból C#-ban
- Konfigurálja a projektkörnyezetet a Aspose.Words használatára a NuGet csomagkezelőből
- Töltse be a bemeneti DOCX fájlt a Document osztályobjektumba
- Szerezze be az összes Paragraph típusú csomópontot a dokumentumból
- Alakítsa át az egyes bekezdéseket karakterláncokká, és jelenítse meg a konzolon
- Szerezze le az összes Futtatás típusú csomópontot a dokumentumból
- Konvertálja az egyes Run elemeket karakterláncokká, és jelenítse meg a betűtípus nevével és méretével együtt
Ezek a lépések megadják a Word fájlolvasó program írásakor végrehajtandó környezet és feladatok konfigurálásához szükséges részletes információkat. Megmutatja, hogyan olvassa be a C# a DOCX fájlt úgy, hogy betölti a forrásfájlt a Document osztály példányába, majd eléri az összes bekezdését a szöveg megjelenítéséhez. Leírja továbbá a bekezdésekből, táblázatokból stb. származó adatok beolvasását úgy, hogy a különböző stílusú szövegek minden egyes szegmense el legyen különítve, vagy minden táblázatcella értéke külön legyen hozzáférhető a feldolgozáshoz.
Kód a Word fájl olvasásához C#-ban
using System; | |
using Aspose.Words; | |
namespace ReadWordDocumentInCSharp | |
{ | |
class Program | |
{ | |
static void Main(string[] args) // Main function to read Word document in C# | |
{ | |
// Create and load license to read DOCX without trial limits | |
License licRotateImage = new License(); | |
licRotateImage.SetLicense("Aspose.Word.lic"); | |
// Load the source Word file to be read | |
Document doc = new Document("input.docx"); | |
// Read all the paragraph in the document and display its contents | |
foreach (Paragraph para in doc.GetChildNodes(NodeType.Paragraph, true)) | |
Console.WriteLine(para.ToString(SaveFormat.Text)); | |
// Read all the Runs in the document and display style and text | |
foreach (Run run in doc.GetChildNodes(NodeType.Run, true)) | |
{ | |
Font font = run.Font; | |
Console.WriteLine(font.Name + "," + font.Size.ToString()); | |
Console.WriteLine(run.Text); | |
} | |
System.Console.WriteLine("Done"); | |
} | |
} | |
} |
Ez a kód bemutatja, *hogyan kell olvasni a Word fájlt C#-ban a Document.GetChildNodes() függvény használatával, amelyhez olyan típusú csomópontot kell lekérni, mint a Bekezdés, Futtatás, Szakasz, Törzs, HeaderFooter, Megjegyzés stb. A gyermekcsomópont elérése után , akkor át kell önteni a megfelelő típusra a metódusainak és tulajdonságainak használatához. Például kétszer olvastuk el a dokumentumot úgy, hogy először a teljes dokumentum összes szövege megjelenik, függetlenül egy normál bekezdéstől, táblázattól stb., a második alkalommal pedig a stílus és a tartalomtípus változása alapján.
Ez a cikk megtanított bennünket a Word-fájlok olvasására, de ha meg szeretné tanulni a Word-dokumentumok konvertálását HTML-be, tekintse meg a hogyan lehet Word dokumentumot HTML-re konvertálni C# segítségével című cikket.