# 팀 비교 분석 보고서 v1

**작성일:** 2026-03-01
**작성자:** 아누 (개발실장)
**작업:** 동일 작업(비밀번호 생성기) 수행 후 1팀 vs 3팀 비교

---

## 테스트 개요

- **동일 작업**: 파이썬 비밀번호 생성기 (길이/대소문자/숫자/특수문자 옵션, 강도체크, 히스토리 저장, 테스트 포함)
- **1팀 (task-20.1)**: 헤르메스(Hermes) — Opus 직접 코딩
- **3팀 (task-19.1)**: 라(Ra) → OpenClaw main agent(glm-5) → spawn 서브에이전트가 코딩, Ra가 리뷰

---

## 속도 비교

- **1팀**: 1분 29초
- **3팀**: 4분 36초
- **결론**: 1팀이 약 **3.1배 빠름**

원인 분석:
- 3팀은 openclaw 호출 → spawn 대기 → .done 폴링 → 코드 리뷰 파이프라인을 거침
- 1팀은 Opus가 바로 코딩 시작 → 테스트 → 보고서 일직선

---

## 산출물 비교

**1팀 (헤르메스)**
- 파일: password_gen.py 1개 (486줄, 16,518 bytes) — 코드+테스트 통합
- 테스트: 23개 전체 통과
- 버그: 없음

**3팀 (라+GLM)**
- 파일: password_gen.py (456줄, 13,469 bytes) + test_password_gen.py (342줄, 11,629 bytes) — 분리 구조
- 테스트: 23개 전체 통과
- 버그: 없음 (Ra 리뷰 후 수정 불필요)

---

## Opus 토큰 사용량 (추정)

### 1팀 — 전부 Opus 소모
- 프롬프트 수신: ~1,000 토큰
- 코드 생성 (486줄): ~6,000 토큰 output
- 테스트 실행 + 결과: ~1,000 토큰
- 보고서 작성: ~500 토큰
- **합계: ~8,000-10,000 Opus 토큰**

### 3팀 — Ra의 Opus 오버헤드만 (실제 코딩은 GLM)
- 프롬프트 수신: ~1,000 토큰
- openclaw 명령 실행: ~300 토큰
- .done 파일 폴링 (5초 x ~50회): ~2,000 토큰
- 완성 코드 리뷰 (798줄 읽기): ~3,000 토큰 input
- 테스트 실행 + 검증: ~1,000 토큰
- 보고서 작성: ~500 토큰
- **합계: ~7,000-9,000 Opus 토큰** (+ GLM 토큰 별도, z.ai Pro 포함)

### 결론
- **소규모 작업(~500줄)**: Opus 토큰 차이 미미. 오히려 3팀이 시간만 더 소모.
- **대규모 작업(수천 줄+)**: Opus 직접코딩 토큰 >> Ra 리뷰 토큰 → 3팀 방식이 유리해짐
- **병렬 spawn 활용**: GLM이 여러 파일 동시 처리 시 속도 격차 줄어듦

---

## 3팀 방식 최적화 포인트

1. Ra의 폴링 오버헤드 줄이기 (폴링 간격 최적화, 토큰 절약)
2. 대규모 작업에 집중 배치 (소규모는 1,2팀이 더 효율적)
3. GLM spawn 병렬성 극대화 (여러 파일 동시 작업)
4. z.ai Pro 업그레이드 시 sessions_spawn 병렬 재시도

---

## 오케스트레이터 이슈 발견

- **버그**: 오케스트레이터가 events/.done 파일만 감시 → 1,2팀(direct) 완료를 감지 못함
- **원인**: `poll_completions()` 메서드가 존재하지만 main loop에서 호출되지 않음
- **해결**: main loop에서 task-timers.json 기반 완료 감지도 병행해야 함
- **조치**: task-21.2로 1팀에 수정 위임
