---
task_id: task-2160
type: plan
scope: task
created: 2026-04-25
updated: 2026-04-25
status: completed
---

# 계획서: task-2160

**task**: task-2160
**목표**: 심평원/건보공단 PDF 5종을 파싱하여 구조화 JSON으로 변환하는 Python 모듈 개발
**승인**: 제이회장님 (MediScan Phase 1-A 계획서 기반)
**근거**: /home/jay/workspace/memory/tasks/task-2160.md

---

## 목표

심평원/건보공단 PDF 5종(세부진료정보, 처방조제정보, 자동차사고기본진료, 자동차사고세부진료, 건강검진결과)을 정확하게 파싱하여 구조화된 JSON으로 변환하는 Python 모듈을 개발한다. 5개 PDF에서 전체 레코드 누락 0건, 컬럼 매핑 100% 정확을 달성한다.

## 범위

### 포함
- Pydantic v2 데이터 모델 (6개 타입)
- 공통 베이스 파서 (pdfplumber 기반)
- 5종 PDF 파서
- PDF 타입 자동 감지 모듈
- 다중 페이지 테이블 연결 로직
- 텍스트 정규화 (줄바꿈, 날짜, 숫자)
- 테스트 코드 35건
- pyproject.toml, requirements.txt

### 제외 (다음 페이즈 이후)
- 분석 엔진 (Phase 1-B)
- 웹 API/서버
- 암호화 PDF 처리
- 기본진료내역 파서 (샘플 없음)

## 위임 계획

- Phase 1-2 (모델+파서): **토르(백엔드/sonnet)**
- Phase 3 (테스트): **헤임달(테스터/sonnet)**

## 검증 기준

- 세부진료정보: 60건 레코드 추출 → 달성
- 처방조제정보: 48건 레코드 추출 → 달성
- 자동차사고기본: 4건, 날짜 정규화, 비용 파싱 → 달성
- 자동차사고세부: 49건 레코드 추출 → 달성
- 건강검진결과: 19항목 시계열 추출 → 달성
- 자동 감지: 5개 PDF 올바른 파서 라우팅 → 달성
- pytest 35/35 passed, pyright 0 errors → 달성
