HowtoAI
ai-tools2026-06-21 5 min read

AI로 PDF에서 표·데이터 추출하는 법 2026 — 스캔본·이미지까지 엑셀로 변환

🤖
HowtoAI 편집팀AI 전문 에디터

AI 기술을 누구나 쉽게 활용할 수 있도록 실전 가이드를 작성합니다. ChatGPT, Claude, AI 자동화, SEO 분야를 전문으로 다룹니다.

📅 2026-06-21⏱️ 5 min read🌐 how-toai.com
목차 보기

핵심 요약 (3줄)

  • 복사가 안 되는 PDF 표도 AI로 추출해 엑셀로 옮길 수 있어요. ChatGPT·Claude·Gemini에 PDF를 올리고 "표를 셀 단위로 정리해줘"라고 하면 되고, 스캔본·이미지도 OCR로 읽어줘요.
  • 양식이 일정하고 단순한 표는 iLovePDF·Adobe·UPDF 같은 전용 변환 도구가 더 빠르고 정확해요. 표가 복잡하거나 가공(열 선택·형식 통일)이 필요하면 AI가 유리해요. 둘을 나눠 쓰는 게 정답이에요.
  • 추출 후엔 행·열 개수, 합계, 헷갈리는 글자 세 가지만 1~2분 대조하면 오독을 거의 잡아내요. 민감 정보가 든 문서는 오프라인 도구나 보안 설정을 먼저 확인하세요.

📋 목차

AI로 PDF 표·데이터를 추출한다는 게 무슨 뜻인가

은행 거래내역서, 거래처가 보낸 견적서, 정부 통계 PDF에서 표만 엑셀로 옮기고 싶은데 복사가 안 돼서 한 칸씩 손으로 옮겨본 적 있으시죠? 표가 100줄만 돼도 30분이 훌쩍 가고, 옮기다 숫자 하나 틀리면 보고서 전체가 어긋나요.

결론부터 말하면, 2026년에는 이 작업을 AI나 전용 도구에 맡길 수 있어요. PDF를 통째로 올리고 "표를 셀 단위로 정리해서 표로 만들어줘"라고 하면 텍스트로 변환해주고, 스캔본·사진처럼 복사가 아예 안 되는 문서도 OCR로 글자를 읽어내요. 다만 도구마다 잘하는 영역이 다르고, 숫자를 잘못 읽는 경우도 있어서 '어떤 문서에 무엇을 쓰고, 받은 결과를 어떻게 검증하느냐'가 시간을 아끼는 핵심이에요.

PDF에서 데이터를 빼내는 기술은 크게 두 갈래예요. 하나는 표 구조를 그대로 엑셀로 옮기는 '변환' 방식(전용 도구), 다른 하나는 문서의 의미까지 이해해서 원하는 형태로 가공해주는 'AI 추출' 방식이에요. 둘은 경쟁 관계가 아니라 서로 보완하는 도구라서, 차이를 알고 골라 쓰는 게 중요해요.

AI로 PDF에서 표 데이터 추출하는 법

AI로 PDF에서 표 데이터를 추출하는 법은 의외로 단순해요. ChatGPT·Claude·Gemini 같은 챗봇에 PDF 파일을 첨부하고, 어떻게 정리할지 한 문장으로 지시하면 돼요. 핵심은 '무엇을, 어떤 형식으로' 받을지 구체적으로 적는 거예요.

기본 프롬프트는 이렇게 시작해요. "첨부한 PDF의 3페이지 표를 셀 단위로 그대로 옮겨서 마크다운 표로 만들어줘. 헤더는 첫 행을 사용하고, 숫자의 천 단위 콤마는 제거해줘." 이렇게 페이지와 처리 규칙을 함께 주면 깔끔하게 나와요. 결과가 마음에 들면 "이걸 .csv 파일로 만들어줘"라고 이어서 부탁하면, 엑셀에서 바로 열 수 있는 파일을 받을 수 있어요.

표가 여러 개거나 페이지가 길면 한 번에 다 넘기지 말고 나눠서 처리하세요. 무료 ChatGPT는 2026년 5월부터 기본 모델이 GPT-5.5 Instant로 바뀌어 무료 플랜에서도 파일 분석과 데이터 분석을 쓸 수 있고, 대화 하나당 파일 10개까지 올릴 수 있어요. 다만 무료는 5시간 단위로 GPT-5.5 사용량 한도가 동적으로 걸려서, 표가 많을수록 페이지를 잘라 올리는 편이 안정적이에요. PDF에서 더 넓게 질문·요약까지 하고 싶다면 긴 보고서·논문을 질문으로 끝내는 AI PDF 문서 분석 가이드에서 분석 쪽 흐름을 따로 정리해뒀어요.

ChatGPT·Claude·Gemini·전용 도구 한눈에 비교

도구마다 강점이 다르니, 문서 종류에 맞춰 고르면 시간을 크게 아낄 수 있어요. 아래 표로 정리했어요.

도구잘하는 영역스캔본(OCR)엑셀·CSV로 받기비용
ChatGPT(GPT-5.5)표 분석·합계·차트, 데이터 가공가능데이터 분석으로 변환무료 가능(한도)
Claude페이지 많은 긴 문서, 계약서·보고서가능(이미지+텍스트)마크다운→붙여넣기무료 가능(한도)
Gemini채팅에서 바로 파일 생성가능.csv·엑셀 직접 생성무료 가능(한도)
iLovePDF·Adobe·UPDF양식 일정한 단순 표 그대로 변환UPDF 등 OCR 지원원클릭 변환무료~유료 혼합
오프라인 변환 도구보안 필요 문서, 인터넷 차단 환경도구에 따라 다름.xlsx 직접 출력대부분 무료

2026년 4월부터 Gemini 앱은 채팅 안에서 PDF·엑셀·워드·CSV 파일을 바로 만들어 다운로드하는 기능이 전 세계 사용자에게 풀렸어요. 그래서 "이 표를 .csv로 만들어줘"가 한 번에 끝나요. 반면 표를 분석해서 증감률·상위 품목까지 계산하는 작업은 데이터 분석 도구가 내장된 ChatGPT가 편하고, 수백 페이지짜리 긴 문서는 컨텍스트 창이 넓은 Claude가 빠지는 표 없이 처리해요.

한 가지 팁은 '한 도구만 고집하지 않는 것'이에요. 같은 PDF를 두 도구에 올려 결과를 교차 확인하면 숫자 오독을 잡기 쉬워요. 표 추출 외에 엑셀 자체를 다루는 흐름은 ChatGPT·엑셀·코파일럿으로 데이터 분석하는 5가지 방법에 더 자세히 적어뒀어요.

스캔본·이미지 PDF에서 표 추출하기

스캔본·이미지 PDF에서 표를 추출하는 법은 일반 PDF와 거의 같지만, OCR 품질이 결과를 좌우해요. 스캔본은 글자가 '그림'이라서, AI가 먼저 이미지 속 글자를 읽어낸 뒤(OCR) 표로 정리하는 구조거든요.

가장 흔한 함정은 숫자 오독이에요. 흐릿한 스캔에서는 0과 6, 1과 7, 8과 B가 헷갈려 잘못 들어가는 일이 생겨요. 그래서 스캔본은 추출 후 검증이 일반 PDF보다 더 중요해요. 추출 정확도를 올리는 방법은 세 가지예요.

  • 스캔을 다시 할 수 있다면 300dpi 이상, 흑백 또는 또렷한 회색조로 받기 (저해상도 사진보다 훨씬 정확해요)
  • 비뚤어지게 찍힌 사진은 똑바로 회전·반듯하게 보정한 뒤 올리기
  • 프롬프트에 "숫자가 흐릿해 애매한 칸은 [확인필요]로 표시해줘"를 추가해 의심 칸을 스스로 표시하게 하기

영수증·명세서처럼 정해진 양식의 스캔 문서를 반복해서 처리한다면, AI보다 OCR이 특화된 전용 도구가 더 일정한 결과를 줄 때가 많아요. 반대로 양식이 매번 다른 비정형 문서는 의미를 이해하는 AI가 유리하고요. 내 문서가 '매번 같은 양식'인지 '제각각'인지부터 따져보면 도구 선택이 쉬워져요.

깨지지 않게 추출하는 5단계 가이드

표가 밀리거나 칸이 어긋나는 사고를 막으려면 순서대로 따라가는 게 좋아요. 아래 5단계면 대부분의 PDF를 안정적으로 옮길 수 있어요.

  1. 목표 정하기 — 전체 표가 필요한지, 특정 열만 필요한지 먼저 정해요. "이 표에서 날짜·금액 두 열만 뽑아줘"처럼 좁히면 오류가 줄어요.
  2. 문서 쪼개기 — 표가 여러 개거나 페이지가 길면 표 하나씩 또는 몇 페이지씩 잘라 올려요. 한 번에 다 넘기면 행·열 경계를 헷갈려요.
  3. 처리 규칙 적기 — "병합 셀은 같은 값을 반복해 채우고, 천 단위 콤마는 빼고, 빈 칸은 비워둬"처럼 규칙을 프롬프트에 명시해요.
  4. 형식 지정해 받기 — 마크다운 표로 받아 눈으로 확인한 뒤, 이상 없으면 .csv·엑셀로 변환을 요청해요.
  5. 원본과 대조하기 — 엑셀에 옮긴 뒤 행·열 개수와 합계를 원본과 비교해요. 여기서 어긋나면 3번으로 돌아가 규칙을 보완해요.

이 흐름의 핵심은 '한 번에 완벽하게'가 아니라 '확인하며 좁혀가기'예요. 특히 3번과 5번을 건너뛰면 칸이 밀린 채로 보고서에 들어가니, 이 두 단계는 꼭 지키세요.

추출 데이터 검증 체크리스트와 흔한 실수

AI가 뽑아준 표는 그럴듯해 보여도 숫자가 틀려 있을 수 있어요. 보고서에 넣기 전 아래 체크리스트로 1~2분만 확인하면 대부분 걸러져요.

  • 행 개수가 원본 표와 같은가 (빠진 줄이 없는지)
  • 열 개수가 원본과 같은가 (칸이 밀리지 않았는지)
  • 합계가 있는 표라면 추출본 합계와 원본 합계가 일치하는가
  • 0/O, 1/l/7, 8/B처럼 헷갈리는 글자가 든 칸 몇 개를 원본과 대조했는가
  • 날짜·통화 형식이 의도한 대로 통일됐는가
  • 민감 정보(이름·번호)가 의도치 않게 그대로 들어가지 않았는가

흔한 실수는 세 가지예요. 첫째, 검증 없이 바로 붙여넣기 — AI는 자신 있게 틀리기도 하니 '합계 대조'만은 습관으로 만드세요. 둘째, 민감 문서를 그냥 업로드하기 — 회사 규정과 보안 설정을 먼저 확인하고, 필요하면 오프라인 도구를 쓰세요. 셋째, 표가 복잡한데 한 번에 넘기기 — 표 하나씩 잘라 올리는 것만으로 정확도가 눈에 띄게 올라가요.

지금 당장 해볼 액션

오늘은 손에 있는 PDF 하나로 흐름을 익혀보세요. 표가 든 PDF를 무료 ChatGPT나 Gemini에 올리고, "이 표를 셀 단위로 마크다운 표로 정리하고, 이상 없으면 .csv로 만들어줘"라고 한 줄만 입력하면 돼요. 받은 결과는 위 체크리스트로 행·열 개수와 합계만 대조해보면, 도구가 얼마나 정확한지 5분 안에 감이 와요.

여기까지 익혔다면 추출한 데이터를 분석·요약하는 다음 단계로 넘어가기 좋아요. 엑셀 데이터를 AI로 분석하고 차트까지 뽑는 방법은 ChatGPT·엑셀·코파일럿 데이터 분석 5가지 방법에서 이어서 확인해보세요.

❓ 자주 묻는 질문 (FAQ)

복사가 안 되는 스캔본 PDF에서도 표를 추출할 수 있나요?

추출할 수 있어요. 스캔본은 글자가 '이미지'라서 일반 복사가 안 되지만, AI와 전용 도구는 OCR(광학문자인식)로 이미지 속 글자를 읽어내요. ChatGPT·Gemini에 스캔 PDF나 사진을 올리고 '이 표를 셀 단위로 옮겨 표로 만들어줘'라고 하면 텍스트로 변환해줘요. 다만 스캔 품질이 나쁘거나 글자가 흐릿하면 숫자를 잘못 읽는 일이 생기니, 추출 후 원본과 한 번 대조하는 단계는 꼭 거쳐야 해요. 깨끗하게 스캔된 문서일수록 정확도가 올라가요.

무료 ChatGPT로도 PDF 표 추출이 되나요?

돼요. 2026년 5월부터 무료 ChatGPT의 기본 모델이 GPT-5.5 Instant로 바뀌었고, 무료 플랜에서도 파일 분석과 데이터 분석 도구를 쓸 수 있어요. 대화 하나당 파일 10개까지 올릴 수 있고, PDF를 올려 표를 정리해달라고 하면 돼요. 다만 무료는 5시간 단위로 GPT-5.5 사용량 한도가 동적으로 적용돼서, 한도를 넘으면 가벼운 모델로 내려가요. 표가 아주 많거나 길면 PDF를 페이지 단위로 나눠 여러 번 올리는 게 안정적이에요.

ChatGPT·Claude·Gemini 중 표 추출은 뭐가 제일 정확한가요?

문서 종류에 따라 갈려요. 페이지가 아주 많은 보고서나 계약서처럼 긴 문서는 컨텍스트 창이 넓은 Claude가 안정적이에요. 표를 분석하고 합계·증감률까지 계산하거나 차트로 보고 싶으면 데이터 분석 도구가 강한 ChatGPT가 편해요. 추출 결과를 바로 .csv·엑셀 파일로 받고 싶으면, 채팅에서 파일을 직접 만들어주는 Gemini가 손이 덜 가요. 한 도구로 안 되면 다른 도구에 같은 PDF를 올려 교차 확인하는 게 2026년의 실전 방식이에요.

전용 변환 도구(iLovePDF·UPDF 등)랑 AI 중 뭘 써야 하나요?

표가 단순하고 양식이 일정하면 전용 변환 도구가 더 빠르고 정확해요. iLovePDF·Adobe Acrobat·UPDF 같은 도구는 'PDF를 엑셀로' 버튼 하나로 표 구조를 그대로 옮겨줘요. 반대로 표가 복잡하거나(병합 셀·다단 레이아웃), 추출하면서 '필요한 열만 골라줘'나 '날짜를 YYYY-MM-DD로 통일해줘' 같은 가공이 필요하면 AI가 유리해요. 정확한 변환은 전용 도구, 유연한 가공은 AI — 이렇게 나눠 쓰면 가장 효율적이에요.

추출한 표가 칸이 밀리거나 깨져요. 왜 그런가요?

표 안에 병합된 셀, 줄바꿈이 들어간 긴 텍스트, 빈 칸이 섞여 있으면 AI가 행·열 경계를 헷갈려서 칸이 밀려요. 이럴 땐 '셀이 병합된 부분은 같은 값을 반복해서 채우고, 빈 칸은 비워둬'처럼 처리 규칙을 프롬프트에 명시하면 좋아져요. 또 한 번에 전체를 넘기기보다 표 하나씩 잘라 올리면 경계 인식이 정확해져요. 받은 결과는 엑셀에 붙여넣고 행 수·열 수가 원본과 맞는지 먼저 확인하세요.

민감한 정보가 든 PDF를 AI에 올려도 되나요?

개인정보·계약 금액·주민번호처럼 민감한 데이터가 든 문서는 주의해야 해요. 회사 규정상 외부 AI 업로드가 금지된 경우도 많고요. 이럴 땐 인터넷 연결 없이 PC에서만 도는 오프라인 변환 도구를 쓰거나, 데이터를 학습에 쓰지 않는 기업용·유료 플랜의 설정을 확인하고 쓰는 게 안전해요. 꼭 AI를 써야 한다면 이름·번호 같은 식별 정보를 가린 뒤 표 구조만 추출하는 방법도 있어요. '편하다'보다 '안전한가'를 먼저 따지세요.

추출한 데이터를 검증하는 가장 빠른 방법은 무엇인가요?

세 가지만 확인하면 대부분 걸러져요. 첫째, 행·열 개수가 원본 표와 같은지 봐요(개수가 다르면 빠지거나 밀린 거예요). 둘째, 합계가 있는 표라면 추출본의 합계와 원본 합계를 비교해요(숫자 오독이 바로 드러나요). 셋째, 0과 O, 1과 l처럼 헷갈리기 쉬운 글자가 든 칸을 몇 개 찍어 대조해요. 이 세 단계는 1~2분이면 끝나고, 잘못된 데이터로 보고서를 만드는 사고를 막아줘요.

📚 함께 읽으면 좋은 글 (Related Posts)

AI 도구 추천 더 보기 →