---
task_id: task-2421
type: plan
scope: task
created: 2026-05-03
updated: 2026-05-03
status: in-progress
---

# 계획서: task-2421 — IDS Phase 1 재작업 + 가벼운 평가 시스템

**task**: task-2421
**목표**: silent corruption 영구 차단 + 5 hybrid 패턴 분화 강제 + 132 design-md 브랜드 적용 자동 검증
**승인**: 제이회장 2026-05-03 "Phase 1 재작업 + 평가 시스템"
**근거**: task-2389(한글 깨짐) + task-2401(단조 그라데이션) silent corruption 회장 직접 5장 시각 확인

## 목표 (회장 명시 3 원칙)
1. 더 가볍게: 인간 BQ+PQ 사이클 폐지 → 단일 자동 코드 평가
2. 더 정확하게: dq-rules.json 코드 수치 검증 (결정론적·재현 가능)
3. 더 퀄리티 높게: retry-until-pass (max 5, 5회 FAIL 시 RuntimeError)

## 범위
### 포함 (Phase 0+1, 본 task에서 완료)
- skills/satori-cardnews/scripts/quality_evaluator.py (727 lines, 5+ 검증 함수)
- skills/satori-cardnews/scripts/retry_loop.py (240 lines)
- tests/skills/satori/test_quality_evaluator.py (617 lines, 18 시나리오)
- 시스템 3문서 (memory/plans/insuro-design-system/)
- task 3문서 (본 디렉토리)

### 회장 승인 게이트 후 (Phase 2~3, 보류)
- 25 stratified 샘플 실 렌더링 + 평가 통과 (Phase 2)
- 3 버전 비교 보고서 v1/v2/v3
- 회장 직접 시각 confirm (Phase 3)

## 위임 계획
- 아마테라스: 시스템 설계 + 3문서
- 벤자이텐 (sonnet): quality_evaluator + retry_loop
- 카구야 (sonnet): 단위 테스트 14건 + 보완 4건
- 마아트 (cross): G2 QC 독립 검증 (95/100 PASS)
- 로키 (opus): G2 적대적 평가 (9 시나리오 → 4 약점 발견 → 모두 보완)
- Codex: 사전 검증 (6 risks 보완 완료)

## 검증 기준
- 빌드 OK / pytest 18건 PASS 14 / SKIP 4 / FAIL 0
- silent corruption 차단 (단조 그라데이션 → FAIL, TV-static smoking_gun → FAIL spatial_diff=40)
- 5 hybrid 패턴 분화 / 브랜드 색 매칭 / 면적 비율 / 한글 OCR 비율 모두 검증
- 회장 승인 게이트 (Phase 2 진입): 보고서 검토 → 미진행 (보류)