Tesseract란?
테서랙트(Tesseract)는 다양한 운영 체제를 위한 광학 문자 인식 엔진입니다. 이 소프트웨어는 Apache License, 버전 2.0에 따라 배포되는 무료 소프트웨어이며 2006년부터 Google에서 개발을 후원했습니다. Tesseract는 1995년 문자 정확도 측면에서 3대 OCR 엔진에 속했으며 Linux, Windows 및 Mac OS X에서 사용할 수 있습니다. 버전 2 이하의 Tesseract는 출력 텍스트 형식, OCR 위치 정보 및 페이지 레이아웃 분석을 지원하게 되었고 Leptonica 라이브러리를 사용하여 여러 가지 새로운이미지 형식에 대한 지원이 추가되었습니다.
현재는 많은 언어 및 스크립트에 대한 LSTM 기반 OCR 엔진 및 모델이 추가되어 총 116개의 언어가 제공됩니다.
<참고 - 위키백과: 테서랙트(Tesseract) >
OCR 개발환경 구성
1. Tesseract Engine 설치
1) Window 에서 Tesseract 설치
a. Windows용 Tesseract 설치 프로그램을 사이트로 이동하여 다운로드 합니다.
b. 설치파일을 실행 합니다.
c. 한국어를 추가합니다.
d. 설치 경로의 경우 Python의 가상환경이 존재하는 드라이브로 설치하는 것을 권장합니다. ( 다른 드라이브에 존재하는 경우 ucrtbase.DLL 모듈 오류가 발생할 수 있습니다.)
5.0 이전에는 환경변수에 Path를 추가하는 옵션이 있었는데, 자동으로 추가 할 경우 일부 문제가 있어서 5.0부터는 없어졌습니다. 수동으로 추가가 필요합니다. Python에서 직접 경로를 입력하여 호출 할 거라면 Path를 추가하지 않으셔도 됩니다.
2. OpenCV와 PyTesseract 설치
PyTesseract 설치 전에 안정적인 개발환경을 위해서 OCR을 위한 Python 가상환경을 만들고 진행 하시기를 권장합니다.
(ocr_env) pip install numpy opencv-contrib-python (ocr_env) pip install pytesseract
이제 컴퓨터에서 Tesseract OCR 엔진 설치가 완료되었고, 또한 OCR, 컴퓨터 비전 및 이미지 처리를 수행하는 데 필요한 필수 Python 패키지를 설치가 완료되었습니다.
3. Trained Data Download
출처: https://yunwoong.tistory.com/51
[ OCR ] Tesseract, PyTesseract 설치방법 (OCR 개발환경) - Python
Tesseract란? 테서랙트(Tesseract)는 다양한 운영 체제를 위한 광학 문자 인식 엔진입니다. 이 소프트웨어는 Apache License, 버전 2.0에 따라 배포되는 무료 소프트웨어이며 2006년부터 Google에서 개발을 후
yunwoong.tistory.com
'Python' 카테고리의 다른 글
[Python/OCR] Tesseract OCR 활용 (심화1) (0) | 2024.07.19 |
---|---|
[Python/OCR] 파이썬 Tesseract OCR 활용(기본) (0) | 2024.07.19 |
[Python] 파이썬 PyAutoGui 라이브러리 : 마우스 키보드 제어 (1) | 2024.07.15 |
[Python] 파이썬을 통한 단순 작업 자동화 구현 (0) | 2024.07.09 |
파이썬 윈도우 응용프로그램 자동화 - pywinauto 말고 Clicknium (0) | 2024.07.03 |