Konwertuj zeskanowany PDF na edytowalny PDF przy użyciu Javy

Ten krótki samouczek wyjaśnia, jak przekształcić zeskanowany PDF na edytowalny PDF przy użyciu Javy. Zawiera szczegóły dotyczące konfiguracji IDE, listę kroków oraz przykładowy kod do przekształcania zeskanowanego PDF na przeszukiwalny PDF przy użyciu Javy. Otrzymasz informacje, jak dostosować proces skanowania obrazu i konwersji treści na czytelny tekst.

Kroki, aby PDF był czytelny przy użyciu Javy

  1. Ustaw IDE, aby używało Aspose.Total for Java do przekształcenia zeskanowanego PDF‑a w przeszukiwalny PDF
  2. Utwórz odpowiednie licencje produktu, aby uniknąć znaków wodnych w wyniku.
  3. Utwórz instancję silnika rozpoznawania przy użyciu klasy AsposeOCR
  4. Utwórz instancję wejściową przy użyciu klasy OcrInput i załaduj do niej źródłowy zeskanowany plik PDF.
  5. Utwórz instancję RecognitionSettings, aby ustawić parametry dostosowywania podczas skanowania obrazu
  6. Wywołaj metodę AsposeOCR.Recognize(), aby pobrać dane ze zeskanowanego PDF i zapisać je w tymczasowym PDF
  7. Załaduj pośredni plik PDF do obiektu klasy Document biblioteki Aspose.PDF i ustaw w nim metadane.
  8. Zapisz ostateczny PDF na dysku z tekstem możliwym do przeszukiwania i metadanymi

Te kroki opisują, jak przekształcić obraz PDF na tekst PDF przy użyciu Javy. Utwórz obiekt silnika rozpoznawania, przygotuj plik wejściowy, dodając zeskanowany plik PDF do obiektu OcrInput, zdefiniuj parametry w obiekcie RecognitionSettings, wywołaj metodę Recognize(), aby zeskanować dane i zapisać wyniki w pośrednim pliku PDF. Na koniec załaduj pośredni plik PDF przy użyciu obiektu Aspose.PDF.Utwórz dokument i dodaj metadane lub sformatuj go dalej przed zapisaniem ostatecznego pliku PDF.

Kod do konwertowania obrazu PDF na tekst w Javie

Ten kod demonstruje, jak przekształcić PDF w przeszukiwalny PDF przy użyciu Javy. Możesz ustawić konkretny język wykrywania podczas skanowania PDF, ustawić flagę automatycznego wykrywania języka, ograniczyć rozpoznawanie do określonych znaków lub wykluczyć znaki, które chcesz, aby OCR zignorował. Dostępne są także opcje wyboru strategii wykrywania obszaru/układu dokumentu źródłowego, jeśli jest to wymagane.

Ten artykuł przedstawił nam proces konwersji pliku PDF do wybieralnego pliku PDF z tekstem. Aby wyeksportować dane z formularza PDF do Excela, odwołaj się do artykułu Eksportowanie danych z formularza PDF do Excela przy użyciu Javy.

 Polski