Tento základní návod vás provede převodem PDF na textový soubor pomocí C#, včetně nastavení konfigurace a spustitelného úryvku kódu. Ukazuje, jak lze pomocí převodníku C# PDF to Text vytvořit pomocí několika volání API. Stačí načíst zdrojový PDF dokument a uložit výstupní Text soubor.
Steps to Convert PDF to Text File using C#
- Chcete-li převést PDF na textový soubor, přidejte do své aplikace odkaz na Aspose.PDF for .NET
- Načtěte zdrojový soubor PDF pomocí instance třídy Document pro vytvoření textového souboru
- Vytvořte instanci třídy TextAbsorber a extrahujte text ze všech stránek
- Uložte výstupní textový soubor
Zde je uveden postup pro zápis PDF to Text converter založené na C# konfiguraci aplikace v .NET frameworku a postup krok za krokem. Jako první krok rychle nakonfigurujte API a načtěte vstupní soubor PDF. Dále přistoupíme k extrahování textu ze všech jeho stránek a zapsání extrahovaného textu do souboru nebo streamu podle požadavků.
Fragment kódu pro převod PDF na text pomocí C#
Použití C# převodu PDF na text funkce může být integrována do vašich aplikací spolu s ovládáním čtení textu ze zdrojového PDF, jako byste mohli číst text ze všech stránek nebo z určité stránky. Podobně, pokud chcete číst text z určité obdélníkové oblasti na stránce PDF, máte možnost definovat i tuto obdélníkovou oblast. Pro převod PDF na text lze také definovat různé režimy, jako je Pure, Raw a MemorySaving.
V tomto článku jsme se dozvěděli, jak lze kód PDF na text C# použít ve vašich aplikacích .NET. Pokud však chcete prozkoumat převod dokumentů PDF do HTML, přečtěte si článek na jak převést PDF do HTML pomocí C#.