# 토큰 절감 시스템 통합 가이드
> 버전: 1.0 | 작성일: 2026-04-07 | task-1506.1
> 참조: https://code.claude.com/docs/en/costs#reduce-token-usage

## 개요
Claude Code 공식 문서에서 도출된 12건의 토큰 절감 기법을 시스템에 적용한 결과를 정리합니다.

---

## 항목 1: 커스텀 압축 지시 (Compact Instructions)
- **파일**: `/home/jay/.cokacdir/workspace/autoset/CLAUDE.md`
- **적용**: `## Compact instructions` 섹션 추가
- **보존 우선순위**: task ID, 팀 배정, 제이회장님 피드백, 진행 중 작업, 에러 정보, 변경 파일 목록
- **효과**: compact 시 핵심 컨텍스트 보존율 향상, 세션 연속성 강화
- **Rollback**: CLAUDE.md에서 `## Compact instructions` 섹션 삭제

## 항목 2: CLAUDE.md → Skills 분리
- **파일**: `/home/jay/.claude/commands/dispatch-rules.md`, `qc-rules.md`, `work-level.md`
- **적용**: 위임 규칙/QC 규칙/작업 레벨 판정을 별도 스킬로 분리
- **효과**: CLAUDE.md 매 세션 토큰 소비 감소 (필요 시에만 스킬 로드)
- **예상 절감**: 세션당 ~2,000토큰 (상세 규칙이 매번 로드되지 않으므로)
- **Rollback**: commands/ 디렉토리에서 3개 파일 삭제, CLAUDE.md에 원본 내용 복원

## 항목 3: MCP 서버 정리
- **파일**: `settings.json`, `CLAUDE.md`
- **적용**: 3개 MCP 서버(openclaw/playwright/glm-mcp) 모두 활성 유지 + 사용 가이드 추가
- **판단**: 3개 모두 활발히 사용 중, CLI 대안 가이드를 CLAUDE.md에 명시
- **효과**: 불필요한 MCP 호출 방지 (CLI 우선 사용 명시)
- **Rollback**: CLAUDE.md에서 `## MCP 서버 사용 가이드` 섹션 삭제

## 항목 4: 테스트 출력 필터링 훅
- **파일**: `/home/jay/workspace/hooks/filter-test-output.sh`
- **등록**: `settings.json` → PreToolUse → Bash 매처에 추가
- **적용**: pytest/jest 실행 감지 시 `--tb=short` 또는 `-q` 옵션 추가 권장
- **효과**: 테스트 전체 출력 대신 요약만 컨텍스트에 유입 → 세션당 수천 토큰 절감
- **Rollback**: settings.json에서 filter-test-output.sh 훅 제거, 파일 삭제

## 항목 5: Extended Thinking 예산 조정
- **파일**: `/home/jay/workspace/memory/specs/thinking-budget-analysis.md`
- **적용**: 분석 완료 — CLI 환경에서 thinking 예산 직접 제어 불가
- **현황**: `effortLevel: "high"` 설정으로 간접 관리 중
- **결론**: API 직접 호출 전환 시 재검토. 현재는 추가 조치 불필요
- **Rollback**: 해당 없음 (문서만 생성)

## 항목 6: /cost 상시 모니터링
- **현황**: `CLAUDE_AUTOCOMPACT_PCT_OVERRIDE: 70` 이미 settings.json에 설정
- **적용**: 추가 설정 불필요 (이미 70% 도달 시 자동 compact 트리거)
- **효과**: 컨텍스트 윈도우 초과 방지, 자동 압축으로 세션 안정성 향상
- **Rollback**: settings.json에서 env.CLAUDE_AUTOCOMPACT_PCT_OVERRIDE 삭제

## 항목 7: 세션 종료 규칙 강화
- **파일**: `/home/jay/workspace/prompts/DIRECT-WORKFLOW.md` (Step 7)
- **적용**: "작업 완료 → 보고서 작성 → .done 생성 → 세션 종료" 명시
- **효과**: 작업 완료 후 불필요한 컨텍스트 누적 방지
- **Rollback**: DIRECT-WORKFLOW.md Step 7에서 세션 종료 규칙 라인 삭제

## 항목 8: LSP 활용 권장 명시
- **파일**: `/home/jay/workspace/prompts/DIRECT-WORKFLOW.md` (Step 3)
- **적용**: "LSP(go-to-definition, find-references) 우선 사용" 명시
- **효과**: grep 대비 정확도 향상 + 불필요한 파일 스캔 감소 → 토큰 절감
- **Rollback**: DIRECT-WORKFLOW.md Step 3에서 LSP 규칙 라인 삭제

## 항목 9: 구체적 프롬프트 규칙 강화
- **파일**: `/home/jay/workspace/prompts/DIRECT-WORKFLOW.md` (Step 2)
- **적용**: 서브태스크에 (1) 대상 파일 경로 (2) 구체적 변경 사항 (3) 테스트 방법 필수 포함
- **효과**: 모호한 지시로 인한 재작업 방지 → 반복 토큰 소비 감소
- **Rollback**: DIRECT-WORKFLOW.md Step 2에서 구체적 지시 규칙 라인 삭제

## 항목 10: 서브에이전트 Haiku 모델 적용 분석
- **파일**: `/home/jay/workspace/memory/specs/haiku-subagent-analysis.md`
- **적용**: 다각도 분석 완료
- **안전한 적용**: 파일 읽기/검색, 단순 설정 수정, 코드 포맷팅
- **적용 불가**: 코드 설계, 리서치, 보고서 작성, 복잡한 로직
- **결론**: DIRECT-WORKFLOW.md에 기존 가이드 충분, 팀장 판단에 위임 유지
- **Rollback**: 해당 없음 (분석 문서만 생성)

## 항목 11: Plan 모드 활용 규칙
- **파일**: `/home/jay/workspace/prompts/DIRECT-WORKFLOW.md` (Step 2)
- **적용**: "Lv.2+ 작업은 plan 모드로 접근법 정리 후 구현" 명시
- **효과**: 설계 없는 코딩으로 인한 재작업 방지
- **Rollback**: DIRECT-WORKFLOW.md Step 2에서 Plan 모드 규칙 라인 삭제

## 항목 12: 점진적 테스트 규칙
- **파일**: `/home/jay/workspace/teams/shared/QC-RULES.md` (섹션 3)
- **적용**: "규칙 4: 점진적 테스트 (파일 단위 검증)" 추가
- **효과**: 일괄 테스트 실패 시 디버깅 비용 감소 → 토큰 절감
- **Rollback**: QC-RULES.md에서 규칙 4 섹션 삭제

---

## 총 효과 예상
- **세션당 절감**: ~3,000-8,000 토큰 (스킬 분리 + 테스트 필터링 + LSP 활용)
- **재작업 감소**: 구체적 프롬프트 + Plan 모드 → 재작업률 20-30% 감소 예상
- **세션 안정성**: compact instructions + 세션 종료 규칙 → 세션 실패율 감소

## 적용 현황 요약
- 코드/설정 변경: 항목 1, 2, 3, 4, 7, 8, 9, 11, 12 (9건)
- 분석/문서화: 항목 5, 6, 10 (3건)
- 기존 시스템 영향: 없음 (모든 변경은 추가적, 기존 동작 유지)