정부24 토지대장 자동 수집기
엑셀 주소 목록으로 정부24에서 토지대장을 자동 발급받고, AI로 소유자 정보를 추출하는 데스크톱 앱. Windows/macOS 지원.

주요 기능
엑셀 파일에서 주소 목록 자동 읽기 및 처리
OpenAI Whisper 기반 음성 캡챠 자동 인식
정부24 자동 로그인 및 토지대장 발급 신청
토지대장/임야대장 자동 구분 처리
PDF 문서 자동 다운로드 및 저장
GPT-4o Vision으로 PDF 분석, 소유자 정보 자동 추출
결과 엑셀 자동 생성 및 ZIP 압축 내보내기
스마트 캐시 시스템으로 중복 작업 방지
electron-updater 기반 자동 업데이트
Windows/macOS 크로스 플랫폼 지원
상세 설명
프로젝트 개요
부동산 업무에서 수백 건의 토지대장을 수작업으로 발급받는 반복 작업을 자동화한 데스크톱 애플리케이션입니다. 엑셀 파일에 주소 목록만 입력하면, 정부24에서 토지대장을 자동으로 발급받고 AI가 소유자 정보까지 추출해줍니다.
기술 스택
Frontend
- Electron - 크로스 플랫폼 데스크톱 앱 프레임워크
- React + TypeScript - 타입 안전한 UI 개발
- electron-vite - 빠른 개발 환경 및 빌드
Backend (Main Process)
- Playwright - 브라우저 자동화 및 웹 스크래핑
- OpenAI Whisper - 음성 캡챠 자동 인식
- GPT-4o Vision - PDF 문서 분석 및 정보 추출
- Zod - 런타임 타입 검증
Infrastructure
- electron-updater - 자동 업데이트 시스템
- IPC Command Router - 메인/렌더러 프로세스 통신
핵심 기능 상세
1. AI 기반 캡챠 자동 해결
정부24 로그인 시 필요한 음성 캡챠를 OpenAI Whisper로 자동 인식합니다.
- 음성 캡챠 오디오 파일 자동 다운로드
- Whisper API로 음성-텍스트 변환
- 한글 숫자(영, 일, 이...) → 아라비아 숫자 자동 변환
- 실패 시 자동 재시도 메커니즘
2. 선언형 태스크 시스템
복잡한 자동화 워크플로우를 선언적으로 정의하고 관리합니다.
- 계층적 태스크 구조 (초기화 → 로그인 → 수집 → 분석 → 저장)
- 태스크별 재시도 횟수 설정
- 실시간 진행 상황 추적 및 UI 표시
- 에러 발생 시 스크린샷/HTML 자동 저장
3. GPT-4o Vision PDF 분석
발급받은 토지대장 PDF에서 소유자 정보를 AI가 자동 추출합니다.
- PDF 파일을 OpenAI에 직접 업로드
- 소유자명, 소유자 주소, 변동일자 자동 추출
- Zod 스키마로 결과 검증
- 토큰 사용량 및 비용 자동 로깅
4. 스마트 캐시 시스템
이미 처리한 주소는 다시 발급받지 않아 시간과 비용을 절약합니다.
- PDF + JSON 캐시 확인으로 중복 작업 방지
- 주소 없음 마커로 실패 케이스도 캐싱
- 당일 캐시 자동 활용
5. 자동 업데이트
사용자가 별도 조치 없이 항상 최신 버전을 사용할 수 있습니다.
- electron-updater 기반 자동 업데이트 확인
- 다운로드 진행률 UI 표시
- 사용자 확인 후 설치 및 재시작
아키텍처
Renderer Process
React UI설정 · 진행상황 · 결과
↕ IPC
Main Process
IPC Command Router
커맨드 라우팅
Playwright
브라우저 자동화
Task Runner
선언형 태스크 시스템
OpenAI APIs
Whisper · GPT-4o
처리 흐름
- 엑셀 읽기 - 주소 목록 파싱 및 검증
- 정부24 로그인 - 음성 캡챠 Whisper 인식 → 자동 로그인
- 토지대장 발급 - 주소별 토지/임야대장 자동 구분 신청
- PDF 다운로드 - 발급된 문서 자동 저장
- AI 분석 - GPT-4o Vision으로 소유자 정보 추출
- 결과 저장 - 엑셀 생성 + ZIP 압축
도입 효과
- 시간 절약: 주소당 3-5분 → 30초 (약 90% 단축)
- 비용 효율: 캐시 시스템으로 중복 API 호출 방지
사용 기술
ElectronReactTypeScriptPlaywrightOpenAIWhisperGPT-4o