Deze korte handleiding helpt u hoe u een DOCX-bestand in Python kunt lezen. Het bevat de volledige informatie die nodig is om de omgeving te configureren, te volgen stappen tijdens het schrijven van de code en een uitvoerbare voorbeeldcode van Python. U kunt ook het DOC-bestand in Python lezen, evenals alle andere door MS Word ondersteunde bestanden met dezelfde instructies.
Stappen om het DOCX-bestand in Python te lezen
- Stel de ontwikkelomgeving in om Aspose.Words voor Python via .NET te gebruiken voor het lezen van een DOCX-bestand
- Importeer de naamruimte aspose.words en stel er een alias voor in
- Laad het invoer-DOCX-bestand in het documentklasse-object dat moet worden gelezen met Python
- Voer een lus uit om alle paragraafknooppunten op te halen uit de geladen DOCX
- Cast elk knooppunt naar een alinea
- Extraheer de inhoud van elke alinea en converteer ze naar een tekenreeks voor weergave
Deze stappen beantwoorden de vraag dat hoe Python een Word-document kan lezen door configuratie en andere noodzakelijke details te delen. Het helpt bij het importeren van de benodigde naamruimten, methoden om het DOCX-bestand te laden, het doorlopen van alle knooppunten van een bepaald type zoals Paragraaf in deze voorbeeldcode en het vervolgens converteren van elke alinea-inhoud naar een tekenreeks voor weergave op de console.
Code om Word-bestand te lezen in Python
Deze code in Python leest Word-bestand door het te laden en vervolgens door alle inhoud te bladeren. U kunt ook de geselecteerde tekst tussen alinea’s lezen en toegang krijgen tot verschillende soorten knooppunten zoals sectie, hoofdtekst, tabel, vorm, opmerking en koptekst om er een paar te noemen. U kunt ook informatie op documentniveau krijgen, zoals ingebouwde eigenschappen, door de Document.built_in_document_properties-verzameling te doorlopen en de eigenschappen “name” en “value” van elk item te gebruiken om de vereiste informatie te krijgen.
Dit artikel heeft het lezen van een Word-bestand in Python gedemonstreerd. Als u geïnteresseerd bent in het maken van een Word-bestand, raadpleeg dan het artikel op hoe een Word-document te maken met Python.