Java'da Word Belgesinden Metin Çıkarma

Bu basit makaleye başvurarak Java’daki Word belgesinden Text dosyasını çıkartabilirsiniz. Geliştirme ortamını ayarlamak için gerekli adımları, adım adım program iş akışını ve DOCX‘yi Java’da TXT’ye dönüştürmek için çalışan bir örnek kodu içerir. Geliştirilen uygulama Linux, MS Windows veya macOS’ta Java destekli herhangi bir ortamda kullanılabiliyor.

Java kullanarak Word’den TXT’ye Dönüştürücüyü geliştirme adımları

  1. Bir DOCX dosyasını Java kullanarak bir TXT dosyasına dönüştürmek için depo yöneticisinden Aspose.Words for Java dosyasını yükleyerek ortamı yapılandırın
  2. Word’den TXT’ye dosya dönüşümü için Document sınıfının bir örneğini oluşturarak kaynak Word belgesini açın.
  3. Gerekli çıktı TXT dosyası özelliklerini ayarlamak için bir TxtSaveOptions sınıfı nesnesi oluşturun
  4. Yüklenen DOCX dosyasını kaydetme yöntemini kullanarak diske TXT dosyası olarak kaydedin

Java’da Word Belgesinden Metin Çıkarma işlemindeki bu kesin adımlar, basit bir API arayüzü kullanılarak gerçekleştirilir. İlk olarak, Document sınıfının bir örneğini kullanarak kaynak DOCX dosyasını diskten yükleyeceğiz, ardından TxtSaveOptions sınıfının bir örneğini kullanarak istenen çıktı TXT dosyası dışa aktarma seçeneklerini ayarlayacağız. Son olarak açılan Word belgesi save yöntemi kullanılarak diske TXT dosyası olarak kaydedilir.

Java’da DOCX’i TXT’ye Dönüştürme Kodu

Yukarıda belirtilen kod örneğinde, diskten DOCX kaynağına erişmek ve Word Belgesinden Metin çıkarmak için Java tabanlı API kullanılmıştır. İsteğe bağlı TxtSaveOptions sınıfı örneğine güvenmeden bir TXT dosyasını diske kaydedebilirsiniz. Ancak istenen TXT dosyasını özelleştirmek istiyorsanız TxtSaveOptions sınıfı tarafından sunulan, birkaçını saymak gerekirse setEncoding(), setForcePageBreaks(), setMaxCharactersPerLine(), setParagraphBreak() ve setPrettyFormat() gibi farklı ayarlayıcı yöntemlerini kullanabilirsiniz.

Bu makale bizi Java* kullanarak bir *Word’den TXT’ye dönüştürücü geliştirme konusunda aydınlattı. Word belgelerini karşılaştırmak ilginizi çekiyorsa Java kullanarak Word Belgelerini karşılaştırın adresindeki makaleye bakın.

 Türkçe