Hur man konverterar HTML-dokument till Word i Python

Den här korta handledningsguiden om hur man konverterar HTML-dokument till Word i Python. Den har detaljerna för att ställa in IDE för att testa exempelkoden, en lista med steg för att skriva applikationen och en körbar exempelkod för att konvertera HTML till DOCX i Python. Exempelkod kommer också att beskrivas för valfri modifiering av den laddade HTML-filen innan den sparas som en Word-fil.

Steg för att konvertera HTML till Word-dokument i Python

  1. Etablera miljön för använd Aspose.Words för Python via .NET för att konvertera HTML till DOCX
  2. Öppna HTML-källfilen med klassobjektet Document från namnområdet aspose.words
  3. Lägg till lite exempeltext till det första stycket i HTML-filen för att demonstrera HTML-ändring
  4. Save den inlästa HTML-filen som en Word-fil genom att ange namn och format

Ovanstående steg definierar processen för att konvertera HTML till Word DOC i Python. Mål-HTML-filen läses in i klassobjektet Document från namnområdet aspose.words. Det här dokumentet sparas som en Word-fil med metoden Document.save() tillsammans med den valfria modifieringen av HTML-filen genom att lägga till lite exempeltext i slutet av första stycket.

Kod för att konvertera HTML-dokument till Word i Python

Denna exempelkod är en enkel HTML till Word-dokumentkonverterare i Python. När HTML-källfilen har laddats in i dokumentklassobjektet kan alla rika funktioner användas för att arbeta med det inlästa dokumentet, till exempel lägga till text i början av första stycket som visas i denna exempelkod, lägga till nya noder, tabeller, diagram, etc. enligt kraven. På samma sätt kan utdatafilen sparas som DOCX, DOC, DOCM, RTF, XPS, SVG, TIFF, PNG, JPEG, GIF och EPS för att lista några.

I den här artikeln har vi lärt oss omvandlingen av HTML till Word i Python. Om du vill lära dig processen att konvertera en HTML-fil till PDF, se artikeln om hur man konverterar HTML till PDF i Python.

 Svenska