Java를 사용하여 스캔된 PDF를 편집 가능한 PDF로 변환

이 짧은 튜토리얼은 Java를 사용하여 스캔한 PDF을 편집 가능한 PDF로 변환하는 방법을 안내합니다. IDE 설정에 대한 세부 정보, 단계 목록 및 Java를 사용하여 스캔한 PDF를 검색 가능한 PDF로 변환하는 샘플 코드가 포함되어 있습니다. 이미지 스캔 및 내용을 읽을 수 있는 텍스트로 변환하는 과정을 맞춤화하는 데 필요한 세부 정보를 얻을 수 있습니다.

Java를 사용하여 PDF를 읽을 수 있게 만드는 단계

  1. IDE를 Aspose.Total for Java을 사용하도록 설정하여 스캔된 PDF를 검색 가능한 PDF로 변환합니다.
  2. 출력에 워터마크가 생기지 않도록 해당 제품 라이선스를 인스턴스화하십시오.
  3. AsposeOCR 클래스를 사용하여 인식 엔진의 인스턴스를 생성합니다.
  4. OcrInput 클래스를 사용하여 입력 인스턴스를 생성하고 원본 스캔 PDF를 로드합니다.
  5. 이미지 스캔 중 맞춤 설정을 위한 매개변수를 설정하려면 RecognitionSettings 인스턴스를 생성합니다.
  6. AsposeOCR.Recognize() 메서드를 호출하여 스캔된 PDF에서 데이터를 가져오고 임시 PDF에 저장합니다.
  7. 중간 PDF를 Aspose.PDF의 Document 클래스 객체에 로드하고 메타데이터를 설정합니다.
  8. 검색 가능한 텍스트와 메타데이터가 포함된 최종 PDF를 디스크에 저장합니다

이 단계에서는 Java를 사용한 PDF 이미지에서 PDF 텍스트 변환 방법을 설명합니다. 인식 엔진 객체를 생성하고, 스캔한 PDF 파일을 OcrInput 객체에 추가하여 입력 파일을 준비하며, RecognitionSettings 객체에서 매개변수를 정의하고, Recognize() 메서드를 호출하여 데이터를 스캔하고 결과를 중간 PDF 파일에 저장합니다. 마지막으로 Aspose.PDF.Document 객체를 사용하여 중간 PDF 파일을 로드하고 메타데이터를 추가하거나 추가 형식을 적용한 후 최종 PDF 파일을 저장합니다.

Java를 사용한 PDF 그림을 텍스트로 변환하는 코드

이 코드는 Java를 사용하여 PDF를 검색 가능한 PDF로 변환하는 방법을 보여줍니다. PDF를 스캔하는 동안 특정 감지 언어를 설정하거나, 언어를 자동 감지하도록 플래그를 설정하고, 특정 문자로 인식을 제한하거나 OCR이 무시하도록 할 블랙리스트 문자를 지정할 수 있습니다. 필요에 따라 원본 문서 영역/레이아웃 감지 전략을 선택할 수 있는 옵션도 제공됩니다.

이 문서는 PDF를 선택 가능한 텍스트 PDF로 변환하는 과정을 알려주었습니다. PDF 양식에서 Excel로 데이터를 내보내려면, 기사 Java를 사용하여 PDF 양식에서 Excel로 데이터 내보내기를 참조하십시오.

 한국인