PDF 스캔 글자인식 방법 알pdf OCR 사용법

IT/Software
2024. 7. 24. 09:52

학업 혹은 사무실에서 문서 작업을 할 때도 스캔을 뜨는 경우가 참 많죠? 보통 이렇게 스캔을 뜨다가 필요한 부분의 글들이 보이면, 텍스트를 다른 곳에 복사할 경우를 생각해서 타이핑을 해야 하는 경우도 있습니다. 한 두장이면 괜찮지만 스캔 뜬 문서, 책 페이지에 문자가 빼곡하다면 너무 힘들지 않을까요? 만약 이 스캔파일의 텍스트가 바로 복사가 가능하다면 하는 생각을 하게 됩니다.

이 포스팅에서는 스캔한 pdf 파일 혹은 jpg 파일에 문자나 글자를 인식하게 하는 OCR 기능의 사용법에 대해 알아보도록 하겠습니다.

contents

OCR 이란?

제목에도 있지만 OCR이 대체 뭘까요? 아마 이 글을 보시는 분들이라면 OCR로 검색을 하고 오신 게 아니라 pdf로 타이핑하다가 현타가 오셔서 글자 인식하는 방법이 없을까 하고 오셨을 겁니다. 그럼 검색어도 글자 인식 방법 혹은 텍스트 인식 방법이라는 식으로 치셨겠죠? 하지만 나오는 글들의 제목을 보면 죄다 OCR이라는 문구가 다 붙어 있었을 겁니다. OCR이 대체 뭐길래?

OCR은 Optical Character Recognition의 약자로 광학 문자 인식이라 불립나다. 쉽게 말해, 사진이나 스캔본에 있는 글자를 컴퓨터가 읽을 수 있는 형식으로 변환하는 기술이라고 생각하면 되겠습니다.

몇 가지 예를 들자면, 다음과 같은 상황에서 OCR이 유용하게 활용됩니다.

문서 스캔: 종이 문서를 스캔하여 텍스트 파일로 저장하고 싶을 때
PDF 변환: PDF 파일 속에 있는 글자를 편집하거나 검색하고 싶을 때
이미지에서 텍스트 추출: 사진 속에 있는 글자를 복사하고 싶을 때

그래서 이런 OCR이 가능하게 하는 소프트웨어, 웹 등의 방법들이 다양하게 있습니다. 제가 오늘 알려드릴 OCR 방식은 알 pdf로 진행할 생각입니다.

왜 알PDF?

아래는 알 pdf 다운로드 페이지입니다.

알PDF | 공식 다운로드

알PDF는 다양한 기능으로 PDF 문서를 간편하게 생성 및 편집하고 다양한 포맷으로 변환할 수 있는 PDF 편집/변환 프로그램입니다.

altools.co.kr

다들 pdf를 보는 뷰어를 하나씩은 가지고 있을 겁니다. adobe도 있고 크롬이나 edge로도 볼 수 있습니다. 저는 이전까지만 해도 따로 정해놓고 쓰는 것은 없었는데 알 pdf를 사용해 보고는 정말 정착하게 되었습니다.

자유로운 문서편집

일단 다른 뷰어들과는 다르게 편집이 자유롭습니다. 저장도 그냥 문서 저장하듯이 가능하고요. 그림이나, 링크 수정, 문서 자체를 회전하거나 서명 넣고 공유하기도 편했습니다.

만약 책 전체를 스캔한 상태라면 이 책 페이지 전체에 대한 수정도 한 번에 가능합니다. 가령 왼쪽이다 오른쪽 페이지 전체에 대한 자르기를 한다면 1페이지부터 100페이지 까지 동일한 수정이 가능하더군요.

포맷 변환

jpg, word, ppt, png 등 정말 자주 사용하는 포맷들 전환이 유용합니다. 우리나라는 외국과 다른 게 무선에서 word만큼 자주 쓰는 포맷이 있죠. hwp 한글 문서입니다. 이 hwp 포맷도 변환 가능합니다. 그 외에 18가지가 변환되니, 어디 다른 pdf로 이동하면서 이 포맷 변환 하겠다고 한 적이 없었던 것 같아요.

OCR 기능

다른 pdf 뷰어 중 이 기능이 같이 탑재된 뷰어를 본 적이 없는 것 같아요. 이게 가능하려면 일단 pdf 자체 편집이 가능해야 한다는 것이기에 알 pdf 가 가장 좋았던 것 같습니다.

물론 다른 웹이나 뷰어에도 OCR이 있긴 합니다만, 얼마나 정확하게 인식을 하는지도 중요합니다. OCR 기능을 사용했는데, 제대로 인식 못해 이상한 글씨가 복붙 되는 상황이 너무 많았었는데, 알 pdf는 제가 수정할게 별로 없을 정도로 인식율이 좋았습니다.

알 PDF 스캔 글자인식 방법

일단 예시 페이지가 있어야겠죠? 제가 스캔한 한 페이지입니다.

▲ 당연히 단순 스캔만 한 상태이기에 문자 인식이 안 되겠죠?

▲ 알 pdf로 이 pdf 파일을 들고 오고 나서 상위 메뉴 중 도구를 클릭합니다.

포함된 기능 중 왼쪽으로 문자인식(OCR)이라는 기능이 보일 겁니다. 클릭해 줍니다.

▲ 3가지 정도를 설정해주셔야 합니다.

스캔옵션

편집 가능한 텍스트로 스캔 - 이미지에 보이는 글 위로 텍스트가 덮입니다. 편집형 글씨가 위로 올라오고 수정도 가능합니다.

이미지에서 검색 가능한 텍스트로 스캔 - 이미지는 원본 상황과 동일합니다. 대신 글씨 위를 커서로 드래그하시면 문자로 스캔이 되는 것을 확인할 수 있습니다.

페이지 범위

OCR 기능을 책 전체에 적용할 것인지 현재 페이지나 혹은 범위도 설정 가능합니다.

문서 언어

OCR도 이미지를 통해 컴퓨터가 읽어내는 형식이기에 정확성을 위해 문서, 책에 있는 문자가 주로 어떠한 언어 인지 설정을 해주는 것이 좋습니다. 한글 문서면 한글 중간에 영어도 섞여 있다면 영어도 함께 넣어주시는 것이 좋겠죠.

그리고 적용을 눌러주시면 되겠습니다.

▲ 위의 한 장의 경우 글씨가 많은 상황이라 2페이지를 하는데 40초가 조금 넘게 걸린 것 같습니다. 만약 책 한 권을 하신다면 OCR 기능을 쓰고 잠깐 다른 일이나 식사하고 오시는 게 좋을 것 같습니다.

▲ 왼쪽이 원본 오른쪽이 OCR이 적용된 상태입니다. 스캔옵션을 편집가능한 상태로 해봤습니다.

글씨체가 완전히 바뀐 것을 볼 수 있습니다. 수정이 가능한 문서텍스트로 전환이 된 것입니다. 그런데 보시면 아시겠지만 문서의 글씨체와 최대한 비슷하게 하려고 했던 모습을 볼 수 있습니다. 글씨 색, 글씨 위치, 크기까지 말이죠. pdf 내에서 수정도 가능합니다.

비교해 보시면 인식율이 매우 높은 것을 볼 수 있습니다.

OCR에 대해 알아봤는데, 어떠신가요? 책 스캔하고 이제 타이핑만 주구장창하는 일은 없었으면 좋겠습니다.

기술이 나날이 발전하는데 굳이 그럴 필요는 없겠죠. 앞으로도 더 좋은 it 정보가 있다면 빠르게 업로드하도록 하겠습니다.~

저작자표시 비영리 변경금지 (새창열림)

도마스핸드