يقدم هذا البرنامج التعليمي القصير تفاصيل حول كيفية ** تحويل PDF إلى نص في Java ** عن طريق تحميل مستند الإدخال PDF وحفظه بتنسيق Text. علاوة على ذلك ، يمكن تخصيص استخدام ** Java PDF to Text Converter ** للتحكم في ما إذا كنت تريد إخراج النص بتنسيق أو بدون تنسيق مقارنة بملف PDF المصدر.
خطوات تحويل PDF إلى نص بجافا
- تكوين التطبيق الخاص بك عن طريق إضافة المرجع إلى Aspose.PDF من مستودع Maven لتحويل PDF إلى ملف نصي
- قم بتحميل ملف PDF المدخل بكائن فئة Document لتحويل PDF إلى ملف نصي
- قم بإنشاء كائن من فئة TextAbsorber لتعيين خيارات استخراج النص
- اكتب النص المستخرج في ملف نصي
توضح الخطوات المذكورة أعلاه عملية تطوير تطبيق المحول المستند إلى * PDF إلى Text Java *. في الخطوة الأولى ، يتم تحميل مستند PDF المدخل باستخدام مثيل فئة المستند ثم حدد ما إذا كنت تريد النص مع التنسيق أم لا. أخيرًا ، يمكنك استخدام السلسلة النصية للكتابة في ملف أو معالجتها وفقًا لمتطلباتك.
كود لتحويل PDF إلى نص في جافا
import com.aspose.pdf.Document; | |
import com.aspose.pdf.License; | |
import com.aspose.pdf.TextAbsorber; | |
import com.aspose.pdf.TextExtractionOptions; | |
import java.io.BufferedWriter; | |
import java.io.FileWriter; | |
import java.nio.file.Files; | |
public class ConvertPdfToTextInJava { | |
public static void main(String[] args) throws Exception { // main method to convert a PDF document to Text file | |
// Instantiate the license to avoid trial limitations while converting the PDF to a text file | |
License asposePdfLicenseText = new License(); | |
asposePdfLicenseText.setLicense("Aspose.pdf.lic"); | |
// Load the source PDF file that is to be converted to Text file | |
Document convertPDFDocumentToText = new Document("input.pdf"); | |
// Instantiate a TextAbsorber class object for converting PDF to Text | |
TextAbsorber textAbsorber = new TextAbsorber(new TextExtractionOptions(TextExtractionOptions.TextFormattingMode.Pure)); | |
// Call the Accept method exposed by the TextAbsorber class | |
convertPDFDocumentToText.getPages().accept(textAbsorber); | |
// Read the text as string | |
String ExtractedText = textAbsorber.getText(); | |
// Create the BufferedWriter object to open the file | |
BufferedWriter writer = new BufferedWriter(new FileWriter(new File("SampleOutput.txt"))); | |
// Write extracted contents to the file | |
writer.write(ExtractedText); | |
// Close writer | |
writer.close(); | |
System.out.println("Done"); | |
} | |
} |
يوضح نموذج التعليمات البرمجية هذا أنه باستخدام * Java قم بتحويل PDF إلى نص * بتحكم كامل باستخدام خيارات مختلفة مثل فئة TextAbsorber ، يحتوي على مُنشِئات متعددة حيث يمكنك استخدام TextSearchOptions الذي يوفر خيار تحويل النص المظلل في PDF المصدر كنص منفصل. وبالمثل ، يمكنك تعيين العلامات للبحث عن نص فقط داخل حدود الصفحة أو تعيين مستطيل للبحث في النص من منطقة محددة فقط في جميع الصفحات.
هنا تعلمنا كيفية تحويل PDF إلى نص في Java مع مقتطف الشفرة. إذا كنت تريد تعلم عملية تحويل PDF إلى Word ، فراجع المقالة على كيفية تحويل PDF إلى Word بجافا.