يرشدك هذا البرنامج التعليمي الأساسي إلى كيفية ** تحويل PDF إلى ملف نصي باستخدام C# ** بما في ذلك إعدادات التكوين ومقتطف التعليمات البرمجية القابل للتشغيل. يوضح كيفية استخدام محول ** C# PDF to Text ** يمكن إنشاؤه مع عدد قليل من استدعاءات API. ما عليك سوى تحميل المستند المصدر PDF وحفظ الملف الناتج Text.
خطوات تحويل PDF إلى ملف نصي باستخدام C#
- أضف مرجعًا إلى Aspose.PDF for .NET في تطبيقك لتحويل PDF إلى ملف نصي
- قم بتحميل ملف PDF المصدر باستخدام مثيل فئة Document لإنشاء ملف نصي
- قم بإنشاء مثيل لفئة TextAbsorber واستخرج النص من كل الصفحات
- احفظ الملف النصي الناتج
لكتابة * PDF to Text Converter C# * تكوين تطبيق في إطار عمل .NET ويتم توفير إجراء خطوة بخطوة هنا. كخطوة أولى ، قم بتكوين API بسرعة وتحميل ملف PDF للإدخال. بعد ذلك ، ننتقل إلى استخراج النص من جميع صفحاته وكتابة النص المستخرج إلى ملف أو دفق وفقًا للمتطلبات.
مقتطف التعليمات البرمجية لتحويل PDF إلى نص باستخدام C#
using System.IO; | |
using Aspose.Pdf; | |
using Aspose.Pdf.Text; | |
namespace ConvertPdfToTextUsingCSharp | |
{ | |
class Program | |
{ | |
static void Main(string[] args) | |
{ | |
// Instantiate the license to avoid evaluation limitations while converting a PDF to Text | |
License PdfToTextLicense = new License(); | |
PdfToTextLicense.SetLicense("Aspose.pdf.lic"); | |
// Open document | |
Document pdfDocument = new Document("PDFtoText.pdf"); | |
// Instantiate a TextAbsorber class object for extracting the text | |
TextAbsorber textAbsorber = new TextAbsorber(new TextExtractionOptions(TextExtractionOptions.TextFormattingMode.Pure),new TextSearchOptions(new Rectangle(5,5,50,50))); | |
// Call the Accept() function to parse all the pages for reading text | |
pdfDocument.Pages.Accept(textAbsorber); | |
// Get extracted text as string | |
string ExtractedText = textAbsorber.Text; | |
// Save the text file | |
File.WriteAllText("PDFtoText.txt" , ExtractedText); | |
System.Console.WriteLine("Done"); | |
} | |
} | |
} |
يمكن دمج ميزة * C# تحويل PDF إلى نص * في تطبيقاتك جنبًا إلى جنب مع التحكم في قراءة النص من ملف PDF المصدر كما يمكنك قراءة النص من جميع الصفحات أو من صفحة محددة. وبالمثل ، إذا كنت تريد قراءة نص من منطقة مستطيلة معينة على صفحة PDF ، فلديك الحرية في تحديد تلك المنطقة المستطيلة أيضًا. يمكن أيضًا تحديد أوضاع مختلفة لتحويل PDF إلى نص مثل Pure و Raw و MemorySaving.
في هذه المقالة ، تعلمنا كيف يمكن استخدام كود * من PDF إلى نص C# * في تطبيقات .NET الخاصة بك. ومع ذلك ، إذا كنت ترغب في استكشاف تحويل PDF إلى مستندات HTML ، فراجع المقالة على كيفية تحويل PDF إلى HTML باستخدام C#.