DOCX fájl olvasása Pythonban

Ez a gyors oktatóanyag végigvezeti Önt hogyan olvassa el a DOCX fájlt Pythonban. Tartalmazza a környezet konfigurálásához szükséges teljes információt, a kódírás során követendő lépéseket, valamint egy futtatható Python-kódot. Ugyanezekkel az utasításokkal elolvashatja a DOC fájlt a Pythonban, valamint az összes többi MS Word által támogatott fájlt is.

Lépések a DOCX fájl olvasásához Pythonban

  1. Állítsa be a fejlesztői környezetet a Aspose.Words for Python .NET-en keresztül használatára a DOCX-fájlok olvasásához
  2. Importálja az aspose.words névteret, és állítson be neki egy álnevet
  3. Töltse be a bemeneti DOCX fájlt a Python használatával olvasandó dokumentum osztály objektumba
  4. Hajtson végre egy ciklust az összes bekezdés csomópontjának lekéréséhez a betöltött DOCX-ből
  5. Minden csomópont átküldése egy bekezdésbe
  6. Vonja ki az egyes bekezdések tartalmát, és alakítsa át karakterláncokká a megjelenítéshez

Ezek a lépések választ adnak arra a kérdésre, hogy hogyan tudja a Python olvasni a Word-dokumentumot a konfiguráció és egyéb szükséges részletek megosztásával. Útmutatást ad a szükséges névterek importálásához, a DOCX-fájl betöltésének módszereihez, egy adott típusú összes csomóponton keresztüli iterációhoz, például ebben a mintakódban a bekezdéshez, majd az egyes bekezdések tartalmát karakterláncokká alakítja a konzolon való megjelenítéshez.

Kód a Word fájl olvasásához Pythonban

import aspose.words as aw
# Initialize the license to avoid trial version limitations
# while reading the word file in python
editWordLicense = aw.License()
editWordLicense.set_license("Aspose.Word.lic")
# Load the source document that needs to be read
docToRead = aw.Document("input.docx")
# Read all the contents from the node types paragraph
for paragraph in docToRead.get_child_nodes(aw.NodeType.PARAGRAPH, True) :
paragraph = paragraph.as_paragraph()
print(paragraph.to_string(aw.SaveFormat.TEXT))

Ez a kód a Python beolvassa a Word fájlt úgy, hogy betölti, majd ismételje meg a teljes tartalmát. A kiválasztott szöveget a bekezdések között is elolvashatja, és hozzáférhet különböző típusú csomópontokhoz, például szakaszhoz, törzshöz, táblázathoz, alakzathoz, megjegyzéshez és fejléc láblécéhez, hogy néhányat felsoroljunk. Dokumentumszintű információkat, például beépített tulajdonságokat is kaphat a Document.built_in_document_properties gyűjtemény iterációjával, és az egyes elemek name és value tulajdonságainak használatával a szükséges információk megszerzéséhez.

Ez a cikk egy Word-fájl Pythonban való olvasását mutatja be. Ha érdekli egy Word-fájl létrehozása, olvassa el a hogyan készítsünk Word dokumentumot Python segítségével című cikket.

 Magyar