Hoe PDF naar tekstbestand te converteren met C#

Deze eenvoudige zelfstudie begeleidt u bij het converteren van PDF naar tekstbestand met C#, inclusief de configuratie-instellingen en een uitvoerbaar codefragment. Het laat zien hoe het gebruik van de C# PDF naar Tekst-converter kan worden gemaakt met een paar API-aanroepen. U hoeft alleen het brondocument PDF te laden en het uitvoerbestand Text op te slaan.

Stappen om PDF naar tekstbestand te converteren met C#

  1. Voeg een verwijzing naar Aspose.PDF for .NET toe aan uw toepassing om PDF naar een tekstbestand te converteren
  2. Laad het bron-PDF-bestand met behulp van de Document klasse-instantie voor het maken van een tekstbestand
  3. Maak een instantie van TextAbsorber klasse en extraheer tekst van alle pagina’s
  4. Sla het uitvoertekstbestand op

Voor het schrijven van PDF naar tekstconverter C# gebaseerde applicatieconfiguratie in .NET framework en een stapsgewijze procedure wordt hier gegeven. Als eerste stap configureert u snel de API en laadt u het invoer-PDF-bestand. Vervolgens gaan we verder met het extraheren van de tekst van alle pagina’s en schrijven de geëxtraheerde tekst naar een bestand of een stream volgens de vereisten.

Codefragment om PDF naar tekst te converteren met C#

Het gebruik van de functie C# convert PDF to Text kan in uw toepassingen worden geïntegreerd, samen met de controle over het lezen van tekst uit de bron-PDF, zoals u tekst van alle pagina’s of van een bepaalde pagina kunt lezen. Evenzo, als u tekst uit een bepaald rechthoekig gebied op de PDF-pagina wilt lezen, hebt u de vrijheid om dat rechthoekige gebied ook te definiëren. Er kunnen ook verschillende modi worden gedefinieerd voor het converteren van PDF naar tekst, zoals Pure, Raw en MemorySaving.

In dit artikel hebben we geleerd hoe PDF naar tekst C#-code kan worden gebruikt in uw .NET-toepassingen. Als u echter de conversie van PDF naar HTML-documenten wilt verkennen, raadpleegt u het artikel op hoe PDF naar HTML te converteren met C#.

 Nederlands