Hoe een lege pagina in Word te verwijderen met Java

In deze korte handleiding wordt uitgelegd hoe u een lege pagina verwijdert in Word met behulp van Java**. Het bevat de details om de ontwikkelomgeving in te stellen, een lijst met programmeertaken voor de applicatie en een uitvoerbare voorbeeldcode die demonstreert hoe u een lege pagina in Word verwijdert met Java. U leert toegang te krijgen tot verschillende soorten inhoud vanuit de hoofdtekst van een sectie op een pagina en het bestaan van tekst of vorm daarin te verifiëren.

Stappen om lege pagina’s in Word te verwijderen met Java

  1. Stel de omgeving in om Aspose.Words for Java te gebruiken om blanco pagina’s te verwijderen
  2. Laad het bron-Word document en bekijk het aantal pagina’s
  3. Parseer door alle pagina’s en verkrijg de text en vormen
  4. Sla de lijst met pagina-indexen op waar geen tekst of vorm aanwezig is
  5. Maak een nieuw Word-document en voeg alle niet-lege pagina’s eraan toe met behulp van de lijst met lege paginanummers
  6. Sla het resulterende Word-bestand op zonder lege pagina’s

Deze stappen geven een samenvatting van hoe u een lege pagina in Word DOC verwijdert met behulp van Java. De gebruikte logica is het laden van het bronwoordbestand en het parseren van elk van de pagina’s om de indexen van blanco pagina’s op te slaan zonder tekst of vormen. Genereer vervolgens een nieuw Word-bestand en voeg alle pagina’s uit het bron-Word-bestand toe aan het nieuwe Word-bestand waarvan de indexen niet aanwezig zijn in de lijst met lege pagina-indexen.

Code om lege pagina’s in Word DOC te verwijderen met Java

import java.util.ArrayList;
import com.aspose.words.*;
public class Main
{
public static void main(String[] args) throws Exception // Delete blank pages in Word files using Java
{
// Set the licenses
new License().setLicense("License.lic");
// Load the source Word file
Document originalDocWithFewBlankPages = new Document("WordFileWithBlankPages.docx");
// Declare list for empty pages
ArrayList<Integer> listOfBlankPageNumbers = new ArrayList<>();
listOfBlankPageNumbers.add(-1);
// Get the page count of the existing Word document
int totalPagesInOriginalDoc = originalDocWithFewBlankPages.getPageCount();
// Iterate through all the pages
for (int iCount = 0; iCount < totalPagesInOriginalDoc; iCount++)
{
// Create a new document using each page
Document DocWithOnePage = originalDocWithFewBlankPages.extractPages(iCount, 1);
// Get text and shapes count on the page
int shapesCounter = 0;
String pageText = "";
for (Section docSection : DocWithOnePage.getSections())
{
pageText = pageText + docSection.getBody().toString(SaveFormat.TEXT);
shapesCounter += docSection.getBody().getChildNodes(NodeType.SHAPE, true).getCount();
}
// Check if the text is empty and no shape is there, save the page index in the list
pageText = pageText.trim();
if((pageText.isEmpty() || pageText == null || pageText.length() == 0) && shapesCounter == 0)
listOfBlankPageNumbers.add(iCount);
}
listOfBlankPageNumbers.add(totalPagesInOriginalDoc);
// Create a new document where pages with some content are added
Document nonEmptyDocument = (Document)originalDocWithFewBlankPages.deepClone(false);
nonEmptyDocument.removeAllChildren();
for (int iCount = 1; iCount < listOfBlankPageNumbers.size(); iCount++)
{
int index = (int)listOfBlankPageNumbers.get(iCount - 1) + 1;
int count = (int)listOfBlankPageNumbers.get(iCount) - index;
if (count > 0)
nonEmptyDocument.appendDocument(originalDocWithFewBlankPages.extractPages(index, count), ImportFormatMode.KEEP_SOURCE_FORMATTING);
}
// Save the output file having all the non-empty pages
nonEmptyDocument.save("NonEmptyPages.docx");
System.out.println("Done");
}
}

Deze voorbeeldcode demonstreert hoe u een lege pagina in Word verwijdert met Java. We gebruikten de methode extractPages() in de klasse Document om toegang te krijgen tot de pagina’s, de methode Section.getBody() om de tekst te extraheren en de methode Section.getChildNodes() met NodeType.SHAPE om de vormen op de pagina te extraheren. Indien nodig kunt u deze code wijzigen om één blanco pagina te verwijderen op basis van de index.

Deze tutorial heeft ons begeleid bij het verwijderen van een lege pagina in Word. Als u alle opmerkingen in een Word-bestand wilt verwijderen, raadpleegt u het artikel op hoe opmerkingen uit een Word-document in Java te verwijderen.

 Nederlands