Jak převést PDF na textový soubor pomocí C#

Tento základní návod vás provede převodem PDF na textový soubor pomocí C#, včetně nastavení konfigurace a spustitelného úryvku kódu. Ukazuje, jak lze pomocí převodníku C# PDF to Text vytvořit pomocí několika volání API. Stačí načíst zdrojový PDF dokument a uložit výstupní Text soubor.

Steps to Convert PDF to Text File using C#

  1. Chcete-li převést PDF na textový soubor, přidejte do své aplikace odkaz na Aspose.PDF for .NET
  2. Načtěte zdrojový soubor PDF pomocí instance třídy Document pro vytvoření textového souboru
  3. Vytvořte instanci třídy TextAbsorber a extrahujte text ze všech stránek
  4. Uložte výstupní textový soubor

Zde je uveden postup pro zápis PDF to Text converter založené na C# konfiguraci aplikace v .NET frameworku a postup krok za krokem. Jako první krok rychle nakonfigurujte API a načtěte vstupní soubor PDF. Dále přistoupíme k extrahování textu ze všech jeho stránek a zapsání extrahovaného textu do souboru nebo streamu podle požadavků.

Fragment kódu pro převod PDF na text pomocí C#

Použití C# převodu PDF na text funkce může být integrována do vašich aplikací spolu s ovládáním čtení textu ze zdrojového PDF, jako byste mohli číst text ze všech stránek nebo z určité stránky. Podobně, pokud chcete číst text z určité obdélníkové oblasti na stránce PDF, máte možnost definovat i tuto obdélníkovou oblast. Pro převod PDF na text lze také definovat různé režimy, jako je Pure, Raw a MemorySaving.

V tomto článku jsme se dozvěděli, jak lze kód PDF na text C# použít ve vašich aplikacích .NET. Pokud však chcete prozkoumat převod dokumentů PDF do HTML, přečtěte si článek na jak převést PDF do HTML pomocí C#.

 Čeština