Bu basit makaleye başvurarak Java’daki Word belgesinden Text dosyasını çıkartabilirsiniz. Geliştirme ortamını ayarlamak için gerekli adımları, adım adım program iş akışını ve DOCX‘yi Java’da TXT’ye dönüştürmek için çalışan bir örnek kodu içerir. Geliştirilen uygulama Linux, MS Windows veya macOS’ta Java destekli herhangi bir ortamda kullanılabiliyor.
Java kullanarak Word’den TXT’ye Dönüştürücüyü geliştirme adımları
- Bir DOCX dosyasını Java kullanarak bir TXT dosyasına dönüştürmek için depo yöneticisinden Aspose.Words for Java dosyasını yükleyerek ortamı yapılandırın
- Word’den TXT’ye dosya dönüşümü için Document sınıfının bir örneğini oluşturarak kaynak Word belgesini açın.
- Gerekli çıktı TXT dosyası özelliklerini ayarlamak için bir TxtSaveOptions sınıfı nesnesi oluşturun
- Yüklenen DOCX dosyasını kaydetme yöntemini kullanarak diske TXT dosyası olarak kaydedin
Java’da Word Belgesinden Metin Çıkarma işlemindeki bu kesin adımlar, basit bir API arayüzü kullanılarak gerçekleştirilir. İlk olarak, Document sınıfının bir örneğini kullanarak kaynak DOCX dosyasını diskten yükleyeceğiz, ardından TxtSaveOptions sınıfının bir örneğini kullanarak istenen çıktı TXT dosyası dışa aktarma seçeneklerini ayarlayacağız. Son olarak açılan Word belgesi save yöntemi kullanılarak diske TXT dosyası olarak kaydedilir.
Java’da DOCX’i TXT’ye Dönüştürme Kodu
import com.aspose.words.Document; | |
import com.aspose.words.License; | |
import com.aspose.words.SaveFormat; | |
import com.aspose.words.TxtSaveOptions; | |
public class HowToConvertWordToText { | |
public static void main(String[] args) throws Exception { //main function for How To Convert Word to Text in Java | |
String path= "/Users/Documents/KnowledgeBase/TestData/"; | |
// Applying product license extract text from DOCX | |
License WordToTextLic = new License(); | |
WordToTextLic.setLicense(path + "Conholdate.Total.Product.Family.lic"); | |
// Load the source DOCX for text conversion | |
Document sourceWordDoc = new Document(path+"Test1.docx"); | |
// Optional Text saving options | |
TxtSaveOptions txtOpts = new TxtSaveOptions(); | |
txtOpts.setMaxCharactersPerLine(100); | |
txtOpts.setSaveFormat(SaveFormat.TEXT); | |
txtOpts.setPrettyFormat(true); | |
// Convert Word to Text | |
sourceWordDoc.save(path + "ExtractedText.txt", txtOpts); | |
System.out.println("Done"); | |
} | |
} |
Yukarıda belirtilen kod örneğinde, diskten DOCX kaynağına erişmek ve Word Belgesinden Metin çıkarmak için Java tabanlı API kullanılmıştır. İsteğe bağlı TxtSaveOptions sınıfı örneğine güvenmeden bir TXT dosyasını diske kaydedebilirsiniz. Ancak istenen TXT dosyasını özelleştirmek istiyorsanız TxtSaveOptions sınıfı tarafından sunulan, birkaçını saymak gerekirse setEncoding(), setForcePageBreaks(), setMaxCharactersPerLine(), setParagraphBreak() ve setPrettyFormat() gibi farklı ayarlayıcı yöntemlerini kullanabilirsiniz.
Bu makale bizi Java* kullanarak bir *Word’den TXT’ye dönüştürücü geliştirme konusunda aydınlattı. Word belgelerini karşılaştırmak ilginizi çekiyorsa Java kullanarak Word Belgelerini karşılaştırın adresindeki makaleye bakın.