Hoe afbeeldingen uit een Word-bestand in Java te extraheren

In deze korte zelfstudie leren we hoe afbeeldingen uit een Word-bestand in Java kunnen worden gehaald. Het bevat alle informatie die nodig is om de omgeving tot stand te brengen, details van het API-gebruik voor het schrijven van de applicatie en een uitvoerbare voorbeeldcode die het proces demonstreert om afbeeldingen uit een Word-document in Java te extraheren. U leert ook verschillende opties om het proces aan te passen terwijl u het bronbestand DOCX laadt en er verschillende afbeeldingen uit extraheert, zoals PNG, JPEG, enz.

Stappen om afbeeldingen uit Word in Java te extraheren

  1. Breng de omgeving tot stand om Aspose.Words for Java toe te voegen voor het extraheren van afbeeldingen
  2. Laad het bron Word-bestand met afbeeldingen in het Document klassenobject
  3. Haal de vormenverzameling op met de getChildNodes()-methode in de Document-klasse
  4. Doorloop alle vormen in de collectie
  5. Controleer of de vorm een afbeelding heeft met behulp van de methode hasImage() in de klasse Shape
  6. Sla de afbeelding op als een apart bestand op de schijf

Deze stappen leggen het proces uit om afbeeldingen uit een Word-bestand in Java te extraheren. Eerst worden de bronnen gedeeld voor de inrichting van de omgeving, gevolgd door de introductie van de klassen, methoden en eigenschappen die nodig zijn om de taak te volbrengen, zoals de Document-klasse wordt gebruikt om het bron-Word-bestand te laden en de methode getChildNodes() wordt gebruikt om alle de beelden ervan. Ten slotte wordt elk element van de collectie getest op het hebben van een afbeelding en, indien gevonden, opgeslagen op de schijf als een afzonderlijk afbeeldingsbestand.

Code om afbeeldingen uit Word-document in Java te extraheren

Deze voorbeeldcode demonstreert het proces om alle afbeeldingen uit een Word-document in Java te extraheren. Nadat het bron-Word-bestand is geladen, wordt de methode getChildNodes() gebruikt door de NodeType.SHAPE-waarde op te geven als argument dat de set van alle vormen in het document retourneert, aangezien de klasse Shape een methode hasImage() heeft die het bestaan van de afbeelding verifieert . Zodra de afbeelding is gedetecteerd, wordt de extensie opgehaald met behulp van de shape.getImageData().getImageType() en gebruikt in de naam van de uitvoerafbeelding, samen met de optie om de afbeeldingen te filteren op basis van hun typen.

In deze tutorial hebben we geleerd hoe je een afbeelding in MS Word kunt invoegen met Java. Als u wilt leren hoe u vanaf het begin een Word-document kunt maken, kunt u het artikel hoe een Word-document te maken met Java raadplegen.

 Nederlands