Programowe czytanie różnego rodzaju dokumentów jest obecnie powszechną praktyką. Z tego poradnika dowiesz się, jak czytać plik PDF w języku C#, wykonując poniższe proste czynności.
Kroki, aby przeczytać plik PDF w C#
- Utwórz pustą aplikację konsolową języka C# w programie Visual Studio
- Dodaj odwołanie do Aspose.PDF for .NET, instalując je z NuGet.org
- Załaduj istniejący plik PDF do obiektu Document
- Zainicjuj klasę TextAbsorber, aby odczytać plik PDF
- Wyodrębnij tekst PDF i zapisz go na wyjściu konsoli
- Przejrzyj stronę PDF Resources, aby znaleźć obrazy
- Utwórz obiekt FileStream ze znalezionym obrazem
- Zapisz obraz na dysku lokalnym
Poniższy fragment kodu wyjaśnia, jak otworzyć i odczytać plik PDF w języku C#. Będziesz mógł czytać tekst i wyodrębniać obrazy z pliku PDF za jego pomocą. API oferuje klasę TextAbsorber, która służy do odczytywania tekstu z pliku PDF, a wyodrębnione wyniki można uzyskać za pomocą obiektu Text. Znajdowanie obrazów i zapisywanie ich na dysku lokalnym jest również możliwe poprzez przeglądanie zasobów strony PDF, jak pokazano poniżej.
Kod do odczytu pliku PDF w C#
W poprzednim temacie nauczyłeś się jak przetwarzać duże pliki PDF w C#. Powyższe informacje i przykładowy kod umożliwią otwieranie i odczytywanie plików PDF w języku C# w celu wyodrębnienia tekstu i obrazów.