Ինչպես կարդալ PDF ֆայլը C#-ում

Տարբեր տեսակի փաստաթղթերի ծրագրային ընթերցումը մեր օրերում սովորական պրակտիկա է: Այս ուղեցույցում դուք կսովորեք, թե ինչպես կարդալ PDF Ֆայլը C#-ում` հետևելով ստորև բերված պարզ քայլերին:

PDF ֆայլը C#-ում կարդալու քայլեր

  1. Ստեղծեք դատարկ C# Console հավելված Visual Studio-ում
  2. Ավելացրեք հղում Aspose.PDF for .NET-ին` տեղադրելով այն NuGet.org-ից
  3. Ներբեռնեք գոյություն ունեցող PDF ֆայլը Document օբյեկտում
  4. Նախաձեռնեք TextAbsorber դասը՝ PDF ֆայլը կարդալու համար
  5. Քաղեք PDF տեքստը և գրեք այն Console-ի ելքում
  6. Կրկնեք PDF էջը Resources՝ պատկերներ գտնելու համար
  7. Ստեղծեք FileStream օբյեկտ գտնված պատկերով
  8. Պահպանեք պատկերը տեղական սկավառակի վրա

Ստորև բերված կոդի հատվածը բացատրում է, թե ինչպես բացել և կարդալ PDF ֆայլը C#-ում: Դուք կկարողանաք կարդալ տեքստը և նկարներ հանել PDF ֆայլից՝ օգտագործելով այն: API-ն առաջարկում է TextAbsorber դաս, որն օգտագործվում է PDF ֆայլից տեքստ կարդալու համար, և դուք կարող եք ստանալ արդյունահանված արդյունքները Text օբյեկտի միջոցով: Պատկերներ գտնելը և դրանք տեղական սկավառակի վրա պահելը հնարավոր է նաև պտտելով PDF էջի ռեսուրսները, ինչպես ցույց է տրված ստորև:

Կոդ՝ PDF ֆայլը C#-ում կարդալու համար

using System;
using System.IO;
// Add reference to Aspose.PDF for .NET API
// Use following namespace to read PDF file
using Aspose.Pdf;
namespace ReadPDFFiles
{
class Program
{
static void Main(string[] args)
{
// Set license before reading PDF file
Aspose.Pdf.License AsposePDFLicense = new Aspose.Pdf.License();
AsposePDFLicense.SetLicense(@"c:\asposelicense\license.lic");
string inFile = @"c:\ReadPDFFileInCSharp.pdf";
// Load an existing PDF file in Document object to read
Document pdf = new Document(inFile);
// 1. Read text from PDF file
// Initialize TextAbsorber Class to read Text from PDF file
Aspose.Pdf.Text.TextAbsorber textAbsorber = new Aspose.Pdf.Text.TextAbsorber();
// Call Page.Accept() method to let TextAbsorber find text in PDF Pages
pdf.Pages.Accept(textAbsorber);
// Write the extracted text to Console output
Console.WriteLine(textAbsorber.Text);
// 2. Extract images from PDF file
int imageIndex = 1;
// Iterate through PDF pages
foreach (var pdfPage in pdf.Pages)
{
// Check available images while reading the PDF
foreach (XImage image in pdfPage.Resources.Images)
{
// Create file stream for found image
FileStream extractedImage = new FileStream(String.Format("Page{0}_Image{1}.jpg", pdfPage.Number, imageIndex), FileMode.Create);
// Save output image to the disk
image.Save(extractedImage, System.Drawing.Imaging.ImageFormat.Jpeg);
// Close stream
extractedImage.Close();
imageIndex++;
}
// Reset image index
imageIndex = 1;
}
}
}
}

Նախորդ թեմայում դուք սովորեցիք ինչպես մշակել մեծ PDF ֆայլեր C#-ում-ը։ Վերոնշյալ տեղեկատվությունը և կոդի օրինակը թույլ կտա ձեզ բացել և կարդալ PDF ֆայլեր C#-ով` տեքստ և պատկերներ հանելու համար:

 Հայերեն