# TODO 백로그

## 미처리 안건

### 1. ~~Docling 처리 속도 최적화 (task-511 이슈)~~ ✅ task-514 완료
- SHA-256 캐시로 48초→0.01초 해결

### 2. ~~한국어 FTS(전문검색) 고도화 (task-510 이슈)~~ ✅ task-514 완료
- pg_trgm + ILIKE fallback 구현. SQL 마이그레이션 파일 생성 (Supabase 미실행)

### 3. Docling 테이블 추출 추가 검증 (task-511 이슈)
- **출처**: task-511 보고서
- **내용**: 금소법 PDF에 정형 표가 없어 Docling의 테이블 추출 우수성을 미검증. 보험 약관 PDF(표 포함)로 추가 테스트 필요.
- **대응**: 제이회장님께 보험 약관 PDF 샘플 확보 요청 → 표 구조 보존 비교 테스트 실행.
- **우선순위**: 낮
- **상태**: 대기

### 4. Docling OCR 활성화 — 스캔 PDF 대응 (task-511)
- **출처**: task-511 보고서 + 제이회장님 지시
- **내용**: 현재 OCR 비활성화 상태(CPU 속도 최적화). 스캔된 PDF(이미지 기반) 파싱 시 OCR 활성화 필요.
- **대응**: 스캔 PDF 파싱이 필요한 시점에 doc_parser.py의 OCR 옵션 활성화. PyTorch 의존성 확인. GPU 없으면 속도 더 느려질 수 있으므로 비동기 처리 병행 검토.
- **트리거**: 제이회장님이 스캔 PDF 처리 요청 시 즉시 대응
- **우선순위**: 대기 (필요시 즉시)
- **상태**: 대기

### 5. libs/ 패키지 구조 정비 (task-510b 경고)
- **출처**: task-510b 보고서 pyright WARN 47건
- **내용**: libs/가 정식 Python 패키지가 아니라 sys.path 기반 동작. `type: ignore[import-not-found]` 12건 + 테스트 파일 pyright 에러 11건.
- **대응**: pyrightconfig.json extraPaths 설정 또는 pyproject.toml 기반 패키지화. 테스트 파일 타입 어노테이션 수정 (chunk dict → TypedDict).
- **우선순위**: 중
- **상태**: 대기

### 6. Supabase pgvector 마이그레이션 실행 (task-512 이슈)
- **출처**: task-512 보고서
- **내용**: 001_pgvector_setup.sql이 아직 InsuRo Supabase에 미적용. 실제 인덱싱/검색 불가.
- **대응**: Supabase 대시보드 SQL Editor에서 수동 실행 필요. 제이회장님 Supabase 대시보드 접근 필요.
- **우선순위**: 높 (Phase 3 기능 동작 전제조건)
- **상태**: 대기

### 7. Drive 동기화 cron 설정 (task-512 이슈)
- **출처**: task-512 보고서
- **내용**: gdrive_sync.py는 1회성 CLI. 주기적 자동 실행을 위한 cron/스케줄러 미설정.
- **대응**: cokacdir --cron으로 일일 동기화 스케줄 등록 또는 systemd timer 설정.
- **우선순위**: 낮
- **상태**: 대기

### 8. PPT 파싱 스킬 설치 검토
- **출처**: 제이회장님 질문
- **내용**: PPT/PPTX 파싱 스킬 `anthropics/skills:pptx` (28.2K) 존재 확인됨. 필요시 설치.
- **대응**: `npx @anthropic-ai/skills add anthropics/skills:pptx`로 설치. Docling도 PPTX 파싱 지원하므로 비교 후 결정.
- **우선순위**: 낮
- **상태**: 대기

---

## 완료된 안건
(없음)
