# 시스템3문서 전수조사 — 문서 vs 실제 구현 완전 검증

## ★ 이 작업은 최우선 긴급 작업입니다 ★

## 배경
시스템3문서(cross-verification-workflow) 체크리스트에서 [x]로 체크된 항목 중 "문서에만 있고 실제 코드에 미반영"된 사례가 반복 발생.
제이회장님 직접 지시: "전수조사 진행. 세부단까지 심층적이고 체계적으로 다 조사"

## 복합팀 구성
- **로키 (DA/레드팀)**: 적대적 검증 — "정말 동작하는가?" 관점에서 의심
- **마아트 (QC)**: 품질 검증 — grep + pytest + 실동작 확인
- **5팀 전원 (마르둑 팀장 Opus)**: 실제 코드 분석 + 실행 테스트

## 조사 범위

체크리스트의 모든 [x] 항목(약 120개)에 대해:

### 검증 방법 (항목별 3단계)
1. **L1 코드 존재**: grep으로 핵심 키워드가 해당 파일에 존재하는지
2. **L2 기능 동작**: pytest 또는 python -c로 해당 기능이 실제 동작하는지
3. **L3 통합 동작**: 다른 모듈과 연결되어 실제 워크플로우에서 동작하는지

### 검증 대상 섹션 (체크리스트 기준)

#### Phase 1 (기반 인프라)
- 1.1 gate_instructions.py — 레벨별 게이트 실제 프롬프트에 삽입되는지
- 1.2 affected_files — 겹침 감지 + Telegram 경고 실동작
- 1.3 batch_id — 배치 완료 조회 실동작
- 1.4 레벨 자동 추정 — 실제 경고 출력
- 1.5 셀프 디버깅 — QC 의무 프롬프트 삽입

#### Phase 3 (교차검증 파이프라인)
- 3.1 사전 리서치 — Codex/Gemini 실제 호출 가능
- 3.2 sanitize — PII 마스킹 실동작 (6종)
- 3.3 Codex — codex_gate_check.py 실행 + 결과 반환
- 3.4 Gemini — PR 리뷰 + severity 분류 실동작
- 3.5 3 Step Why — 프롬프트에 실제 삽입
- 3.6 HIGH/MEDIUM — 자동 수정 + 분류 실동작
- 3.7 CodeGraph — AST 통합 실동작

#### 3문서 체계 (task-1872)
- 자동 생성 — dispatch level 3 시 실제 디렉토리 생성
- team_prompts — Lv.3 프롬프트에 3문서 섹션 삽입
- three_docs_check — QC 검증기 실동작
- verification-before-completion — .done 전 3문서 검증

#### 보고서≠구현 방지 (task-1874)
- Tier 1-A: DIRECT-WORKFLOW Edit grep 검증
- Tier 1-B: planned/verified 보고서 형식
- Tier 2-A: Large-File Protocol 프롬프트 삽입
- Tier 2-B: symbol_existence_check 실동작
- Tier 2-C: file_touch_ratio_check 실동작
- Tier 3-A: g3_independent_verifier 실동작

#### Phase 5 (통합 테스트 + 효과 측정)
- 5.1 통합 테스트 10개 — pytest 전부 PASS 확인
- 5.2 auto_merge.py — 스크립트 존재 + import 성공
- 5.3 collect_metrics.py — 실행 + JSON 생성

#### 횡단 항목
- 검증 게이트 L1 스모크테스트 — DIRECT-WORKFLOW + QC-RULES + team_prompts
- 한정승인 × 게이트 — anu-guide + DIRECT-WORKFLOW
- 와치독 비활성화 — session-watchdog.sh 재위임 주석 처리
- dispatch Phase 감지 경고 — _warn_phase_without_explicit_id 존재

## 산출물
1. **전수조사 보고서**: `memory/reports/system3docs-full-audit.md`
   - 항목별 PASS/FAIL/PARTIAL 판정
   - FAIL 항목: 누락 내용 + 수정 필요 범위
   - 위험도 분류: CRITICAL(기능 미동작) / WARN(부분 누락) / INFO(문서만 미흡)
2. **체크리스트 수정 제안**: FAIL 항목 → [ ]로 되돌리기 제안 목록

## 주의
- 이 작업은 코드 수정을 하지 않음 — 조사 + 보고서만
- 각 항목별 최소 1개의 실제 실행 증거(grep 결과, pytest 결과, curl 결과) 포함
- "보고서에 있으니까 됐다"는 증거로 인정 안 함 — 실제 코드에서 확인해야 함
- 대용량 파일은 offset/limit으로 읽기