Het programmatisch lezen van verschillende soorten documenten is tegenwoordig een gangbare praktijk. In deze handleiding leert u hoe u PDF Bestand in C# kunt lezen door onderstaande eenvoudige stappen te volgen.
Stappen om PDF-bestand te lezen in C#
- Maak een lege C# Console-toepassing in Visual Studio
- Voeg een verwijzing toe naar Aspose.PDF for .NET door het te installeren vanaf NuGet.org
- Laad een bestaand PDF-bestand in Document-object
- Initialiseer TextAbsorber Class om PDF-bestand te lezen
- PDF-tekst extraheren en naar console-uitvoer schrijven
- Doorloop de PDF-pagina Resources om afbeeldingen te vinden
- Maak een FileStream-object met gevonden afbeelding
- Sla de afbeelding op de lokale schijf op
Onderstaand codefragment legt uit hoe u een PDF-bestand in C# kunt openen en lezen. U kunt tekst lezen en afbeeldingen uit een PDF-bestand extraheren door het te gebruiken. De API biedt TextAbsorber Class die wordt gebruikt om tekst uit een PDF-bestand te lezen en u kunt de geëxtraheerde resultaten bereiken via Text object. Afbeeldingen zoeken en opslaan op de lokale schijf is ook mogelijk door door PDF Page-bronnen te bladeren, zoals hieronder wordt weergegeven.
Code om PDF-bestand te lezen in C#
In het vorige onderwerp heb je hoe grote PDF-bestanden te verwerken in C# geleerd. Met de bovenstaande informatie en het codevoorbeeld kunt u PDF-bestanden openen en lezen in C# om tekst en afbeeldingen te extraheren.