# Extended Thinking Budget 분석

작성일: 2026-04-07
작성자: 루(Lugh) / 개발3팀 / task-1506.1

## 분석 배경

Claude Code CLI 환경에서 Extended Thinking 예산을 직접 제어할 수 있는지 조사.

## 기술적 사실

### API 레벨
- Extended Thinking budget은 Anthropic API 호출 시 `max_tokens` 파라미터와 `thinking.budget_tokens` 파라미터로 제어
- API 직접 호출 시: `{"type": "thinking", "budget_tokens": 10000}` 형태로 설정 가능

### Claude Code CLI 환경
- Claude Code는 CLI 환경으로, 사용자가 API 파라미터를 직접 제어할 수 없음
- `settings.json`의 `env` 섹션에 thinking 관련 환경변수 없음 (없는 것이 정상)
- Claude Code는 내부적으로 thinking을 자체 관리함

### 현재 설정 상태
- `settings.json`의 `effortLevel: "high"` 설정으로 간접적으로 thinking 품질 관리 중
- `CLAUDE_AUTOCOMPACT_PCT_OVERRIDE: 70` — 컨텍스트 70% 도달 시 자동 compact
- dispatch.py에서 작업 레벨별 차등 thinking 설정은 CLI 환경에서 적용 불가

## 결론

**현재 Claude Code CLI 환경에서는 thinking 예산 직접 제어 불가.**

- effortLevel 설정("high")으로 간접 관리 중
- 작업 레벨별(Lv.0~Lv.4) thinking 예산 차등 적용을 원한다면 API 직접 호출 방식으로 전환 필요
- API 전환 시 재검토 필요

## 권고사항

1. 현재 구조 유지 (effortLevel: "high")
2. 토큰 절감이 주 목적이라면 thinking 예산보다 compact 전략이 더 효과적
3. 장기적으로 API 전환 고려 시 dispatch.py에 `thinking.budget_tokens` 파라미터 추가 설계 가능
