Kaip konvertuoti PDF į tekstinį failą naudojant C#

Šiame pagrindiniame vadove sužinosite, kaip konvertuoti PDF į tekstinį failą naudojant C#, įskaitant konfigūracijos nustatymus ir paleidžiamą kodo fragmentą. Tai parodo, kaip naudojant C# PDF į tekstą keitiklį galima sukurti keliais API iškvietimais. Jums tereikia įkelti šaltinio PDF dokumentą ir išsaugoti išvesties Text failą.

Veiksmai, kaip konvertuoti PDF į tekstinį failą naudojant C#

  1. Pridėkite nuorodą į Aspose.PDF for .NET į savo programą, kad konvertuotumėte PDF į tekstinį failą
  2. Įkelkite šaltinio PDF failą naudodami Document klasės egzempliorių, kad sukurtumėte tekstinį failą
  3. Sukurkite TextAbsorber klasės egzempliorių ir ištraukite tekstą iš visų puslapių
  4. Išsaugokite išvesties tekstinį failą

Norėdami rašyti PDF į teksto keitiklį C# pagrįstą taikomosios programos konfigūraciją .NET sistemoje, ir žingsnis po žingsnio pateikta procedūra. Pirmiausia greitai sukonfigūruokite API ir įkelkite įvesties PDF failą. Toliau mes ištraukiame tekstą iš visų jo puslapių ir įrašome ištrauktą tekstą į failą arba srautą pagal reikalavimus.

Kodo fragmentas, skirtas konvertuoti PDF į tekstą naudojant C#

Naudojant C# konvertavimo PDF į tekstą funkciją galima integruoti į jūsų programas ir valdyti teksto skaitymą iš šaltinio PDF, pavyzdžiui, galite skaityti tekstą iš visų puslapių arba iš nurodyto puslapio. Panašiai, jei norite skaityti tekstą iš tam tikros stačiakampio srities PDF puslapyje, turite teisę apibrėžti ir tą stačiakampę sritį. Taip pat galima nustatyti skirtingus PDF konvertavimo į tekstą režimus, pvz., Pure, Raw ir MemorySaving.

Šiame straipsnyje sužinojome, kaip PDF į tekstą C# kodas gali būti naudojamas jūsų .NET programose. Tačiau, jei norite ištirti PDF konvertavimą į HTML dokumentus, žr. straipsnį kaip konvertuoti PDF į HTML naudojant C#.

 Latviski