Tento rychlý tutoriál vás provede jak smazat prázdnou stránku v Word pomocí Javy. Obsahuje podrobnosti pro nastavení vývojového prostředí, seznam programovacích úloh pro aplikaci a spustitelný ukázkový kód demonstrující jak odstranit prázdnou stránku ve Wordu pomocí Javy. Naučíte se přistupovat k různým typům obsahu z těla sekce na stránce a ověřovat existenci textu nebo tvaru v ní.
Kroky k odstranění prázdné stránky ve Wordu pomocí Java
- Nastavte prostředí tak, aby k odstranění prázdných stránek používalo Aspose.Words for Java
- Načtěte zdrojové slovo document a zjistěte počet jeho stránek
- Analyzujte všechny stránky a získejte jejich text a tvary
- Uložte seznam indexů stránek, kde není přítomen žádný text ani tvar
- Vytvořte nový dokument aplikace Word a přidejte do něj všechny neprázdné stránky pomocí seznamu čísel prázdných stránek
- Uložte výsledný soubor aplikace Word, který neobsahuje žádné prázdné stránky
Tyto kroky shrnují jak odstranit prázdnou stránku ve Word DOC pomocí Java. Použitá logika spočívá v načtení souboru zdrojového slova a analýze každé z jeho stránek, aby se uložily indexy prázdných stránek bez textu nebo tvarů. Následně vygenerujte nový soubor aplikace Word a do nového souboru aplikace Word přidejte všechny stránky ze zdrojového souboru aplikace Word, jejichž indexy se nenacházejí v seznamu indexů prázdných stránek.
Kód pro odstranění prázdné stránky ve Word DOC pomocí Java
import java.util.ArrayList; | |
import com.aspose.words.*; | |
public class Main | |
{ | |
public static void main(String[] args) throws Exception // Delete blank pages in Word files using Java | |
{ | |
// Set the licenses | |
new License().setLicense("License.lic"); | |
// Load the source Word file | |
Document originalDocWithFewBlankPages = new Document("WordFileWithBlankPages.docx"); | |
// Declare list for empty pages | |
ArrayList<Integer> listOfBlankPageNumbers = new ArrayList<>(); | |
listOfBlankPageNumbers.add(-1); | |
// Get the page count of the existing Word document | |
int totalPagesInOriginalDoc = originalDocWithFewBlankPages.getPageCount(); | |
// Iterate through all the pages | |
for (int iCount = 0; iCount < totalPagesInOriginalDoc; iCount++) | |
{ | |
// Create a new document using each page | |
Document DocWithOnePage = originalDocWithFewBlankPages.extractPages(iCount, 1); | |
// Get text and shapes count on the page | |
int shapesCounter = 0; | |
String pageText = ""; | |
for (Section docSection : DocWithOnePage.getSections()) | |
{ | |
pageText = pageText + docSection.getBody().toString(SaveFormat.TEXT); | |
shapesCounter += docSection.getBody().getChildNodes(NodeType.SHAPE, true).getCount(); | |
} | |
// Check if the text is empty and no shape is there, save the page index in the list | |
pageText = pageText.trim(); | |
if((pageText.isEmpty() || pageText == null || pageText.length() == 0) && shapesCounter == 0) | |
listOfBlankPageNumbers.add(iCount); | |
} | |
listOfBlankPageNumbers.add(totalPagesInOriginalDoc); | |
// Create a new document where pages with some content are added | |
Document nonEmptyDocument = (Document)originalDocWithFewBlankPages.deepClone(false); | |
nonEmptyDocument.removeAllChildren(); | |
for (int iCount = 1; iCount < listOfBlankPageNumbers.size(); iCount++) | |
{ | |
int index = (int)listOfBlankPageNumbers.get(iCount - 1) + 1; | |
int count = (int)listOfBlankPageNumbers.get(iCount) - index; | |
if (count > 0) | |
nonEmptyDocument.appendDocument(originalDocWithFewBlankPages.extractPages(index, count), ImportFormatMode.KEEP_SOURCE_FORMATTING); | |
} | |
// Save the output file having all the non-empty pages | |
nonEmptyDocument.save("NonEmptyPages.docx"); | |
System.out.println("Done"); | |
} | |
} |
Tento ukázkový kód ukazuje jak odstranit prázdnou stránku v aplikaci Word pomocí Java. Pro přístup ke stránkám jsme použili metodu extractPages() ve třídě Document, metodu Section.getBody() k extrahování textu a metodu Section.getChildNodes() s NodeType.SHAPE k extrahování tvarů na stránce. V případě potřeby můžete tento kód upravit tak, aby smazal jednu prázdnou stránku na základě jejího indexu.
Tento tutoriál nás navedl k tomu, abychom odstranili prázdnou stránku ve Wordu. Pokud chcete smazat všechny komentáře v souboru aplikace Word, přečtěte si článek na jak odstranit komentáře z dokumentu aplikace Word v Javě.