Šioje trumpoje pamokoje sužinosite, kaip perskaityti DOCX failą naudojant Python. Jame yra visa informacija, reikalinga aplinkai konfigūruoti, veiksmai, kurių reikia laikytis rašant kodą, ir paleidžiamas Python kodo pavyzdys. Taip pat galite skaityti DOC failą Python, taip pat visus kitus MS Word palaikomus failus, vadovaudamiesi tomis pačiomis instrukcijomis.
Veiksmai, kaip skaityti DOCX failą Python
- Nustatykite kūrimo aplinką, kad DOCX failo skaitymui būtų naudojama Aspose.Words, skirtas Python per .NET
- Importuokite aspose.words vardų erdvę ir nustatykite jai slapyvardį
- Įkelkite įvesties DOCX failą į dokumentų klasės objektą, kuris turi būti skaitomas naudojant Python
- Vykdykite ciklą, kad gautumėte visus pastraipos mazgus iš įkelto DOCX
- Perkelkite kiekvieną mazgą į pastraipą
- Ištraukite turinį iš kiekvienos pastraipos ir konvertuokite į eilutę, kad būtų rodomas
Šie veiksmai atsako į klausimą, kaip Python gali nuskaityti Word dokumentą, bendrindamas konfigūraciją ir kitą reikiamą informaciją. Jame nurodoma, kaip importuoti būtinas vardų sritis, kaip įkelti DOCX failą, kartoti visus konkretaus tipo mazgus, pvz., pastraipą šiame pavyzdiniame kode, ir konvertuoti kiekvieną pastraipos turinį į eilutę, kad būtų rodoma konsolėje.
Kodas, skirtas skaityti Word failą Python.
Šis kodas Python nuskaitė Word failą jį įkeldamas ir kartodamas visą jo turinį. Taip pat galite perskaityti pasirinktą tekstą tarp pastraipų ir gauti prieigą prie įvairių tipų mazgų, pvz., skyriaus, teksto, lentelės, formos, komentaro ir antraštės poraštės. Taip pat galite gauti dokumento lygio informaciją, pvz., įtaisytąsias ypatybes, kartodami per Document.built_in_document_properties rinkinį ir naudodami kiekvieno elemento ypatybes “pavadinimas” ir “vertė”, kad gautumėte reikiamą informaciją.
Šiame straipsnyje parodytas Word failo skaitymas Python. Jei jus domina Word failo kūrimas, žr. straipsnį Kaip sukurti Word dokumentą naudojant Python.