# MoAI-ADK 도입 체크리스트

## Phase 0: 기초 (Week 0, 3/31~4/6)

### Phase 0a: 기준선 측정 (4/1~4/3) [CODE FREEZE] DRI: 마아트
- [ ] 측정 도구 사전 검증 (3/31) — .metrics/ 수집 스크립트 동작 확인
- [ ] .metrics/baseline/ 디렉토리 생성
- [ ] build_prompt 토큰 측정
- [ ] QC 패스율 측정
- [ ] QC FNR 측정 (30건 재검증)
- [ ] QC 실행시간 측정
- [ ] 세션 Write/Edit 횟수 측정
- [ ] 토큰 소비량 측정
- [ ] worktree 성공률 측정
- [ ] 기준선 JSON 저장
- [ ] git tag baseline-v1

### Phase 0b: 인프라 (4/4~4/6) DRI: 헤르메스
- [ ] feature_flags.json 스키마 작성 (위치: .claude/feature_flags.json)
- [ ] utils/feature_flags.py 구현
- [ ] atomic write 구현
- [ ] P1-1 구현 스펙 문서 작성 (/memory/specs/adk-impl-spec-1.md)
- [ ] P1-2 구현 스펙 문서 작성 (/memory/specs/adk-impl-spec-2.md)
- [ ] P1-7 구현 스펙 문서 작성 (/memory/specs/adk-impl-spec-7.md)
- [ ] P2-3 스펙 문서 초안 (/memory/specs/adk-impl-spec-3.md)
- [ ] P2-4 스펙 문서 초안 (/memory/specs/adk-impl-spec-4.md)
- [ ] P2-5 스펙 문서 초안 (/memory/specs/adk-impl-spec-5.md)

## Phase 1: P1 구현 (Week 1-3)

### P1-1: Progressive Disclosure (Week 1-2, DRI: 헤르메스)
- [ ] build_prompt()에 disclosure_phase 파라미터 추가
- [ ] summary 모드 구현 (≤600토큰)
- [ ] standard 모드 구현 (≤1800토큰)
- [ ] CRITICAL 셋 하드코딩 (~80토큰)
- [ ] feature_flag: progressive_disclosure_enabled
- [ ] 단위 테스트 작성
- [ ] 비율 검증 (15-25% / 40-60%)
- [ ] 회귀 테스트 통과
- [ ] 효과 측정 (기준선 대비)
- [ ] 데드라인: 4/14

### P1-2: 읽기/쓰기 격리 (Week 1-2, DRI: 헤르메스)
- [ ] dispatch.py --agent-type 파라미터 추가
- [ ] worktree_manager.py --read-only 플래그 추가
- [ ] DIRECT-WORKFLOW.md 섹션 5 추가
- [ ] feature_flag: rw_isolation_enabled
- [ ] 단위 테스트 작성
- [ ] 회귀 테스트 통과
- [ ] 데드라인: 4/14

### P1-7: hooks 자동 강제 (Week 3, DRI: 헤르메스)
- [ ] settings.json PostToolUse 훅 추가
- [ ] pyright 검사 스크립트
- [ ] ruff 검사 스크립트
- [ ] 심각도 2단계 구현 (critical=중단, standard=경고)
- [ ] circuit breaker 구현: warning=15회 누적, critical=30회 누적, 동일 (tool,error_code,file_path) 3-튜플 3회 연속=즉시 halt
- [ ] feature_flag: hooks_enforcement_enabled
- [ ] 단위 테스트 작성
- [ ] QC-RULES.md "hooks≠QC면제" 규칙 추가
- [ ] 회귀 테스트 통과
- [ ] 데드라인: 4/24 (Week 3 마감, 계획서 기준)

### [버퍼] 4/17(금) 리뷰 + 버그 수정

## Phase 2: P2 구현 (Week 3-8)

### P2-4: TRUST 5 태그 (Week 3, DRI: 마아트)
- [ ] qc_verify.py trust_summary JSON 구현
- [ ] verifier 9종→TRUST 5차원 매핑 정의
- [ ] 매핑 불일치율 <3% 검증
- [ ] feature_flag: trust5_tagging_enabled
- [ ] 단위 테스트 작성
- [ ] 데드라인: 4/27

### P2-5: 모델 매핑 테이블 (Week 4, DRI: 헤르메스)
- [ ] team_prompts.py MODEL_MAP 상수 추가
- [ ] _build_cowork_section() 모델 가이드 삽입
- [ ] staleness 7일 경고 구현
- [ ] feature_flag: model_map_enabled
- [ ] 단위 테스트 작성
- [ ] 데드라인: 5/4

### P2-3: haiku 전용화 A/B (Week 4-8, DRI: 마아트)
- [ ] A/B 분기 구현 (QC 50% haiku / 50% sonnet)
- [ ] 주 1회 sonnet 재검증 20% 설정
- [ ] Fisher's exact test 분석 스크립트
- [ ] n>150 데이터 수집
- [ ] FNR<15% 검증
- [ ] α=0.05 유의수준 판정
- [ ] 최종 채택/기각 결정
- [ ] 데드라인: 5/31

## Phase 3: 통합 테스트 + 효과 측정 (Week 4)
- [ ] INT-01~07 통합 테스트 전부 실행
- [ ] P1 효과 측정 (기준선 대비)
- [ ] 효과 보고서 작성

## Phase 4: P3 설계 (Week 5-8)
### P3-10: Task 파일 구조 표준화 (DRI: 오딘)
- [ ] 현재 task 파일 네이밍 패턴 분석
- [ ] YAML frontmatter 스키마 설계
- [ ] 네이밍 규칙 문서화
- [ ] 파일럿 적용 (5개 task)

## Phase 5: 최종 평가 (Week 8)
- [ ] A/B 최종 판정
- [ ] 전체 P1/P2 평가 보고서
- [ ] P3 실구현 여부 결정
- [ ] P4 재논의 트리거 점검
- [ ] 프로젝트 회고