# Agent 미팅: 스킬 품질 평가 + 자기학습 시스템 설계

**날짜**: 2026-03-24
**총 라운드**: Round 3 (Lv.3 설계) + Round 4 (제이회장님 직접 참여)
**최종 설계서**: `memory/specs/skill-eval-self-learning-design.md` (v1.2 최종 확정)

---

## Round 3 (Lv.3 설계 미팅)

**참여**: 오딘(초안), 헤르메스(실현성), 프로메테우스(공정성), 로키(DA)
**모드**: sequential

**주요 결론**:
- 4파일 스키마, composite scoring, 3계층 라우팅 제안 (오딘)
- skill-creator eval은 트리거 전용, Quality Eval 신규 필요 (헤르메스 CRITICAL)
- 단일 composite 불공정, 카테고리별 분리 필요 (프로메테우스)
- SPOF 우려, "사용 빈도 로그 + 큐레이션"이 더 단순 (로키)

**합의**: Phase 0(사용 빈도 로그) 우선 → 이후 데이터 기반 판단

---

## Round 4 (제이회장님 직접 참여)

**참여**: 오딘→제이회장님 피드백→헤르메스→제이회장님 피드백→프로메테우스→제이회장님 피드백→로키(DA)→아누 종합
**모드**: sequential + 제이회장님 인터랙티브

### 제이회장님 핵심 방향 보정
1. 시간 압박 — 빠르게 고도화, 과잉설계 지양
2. "사용 빈도"는 업무 의존 변수 → Phase 0 기각
3. 84개 스킬 전부 필요 (축소 기각)
4. 시스템 스킬: AI가 더 잘 안다, 자율 학습
5. 사업용 스킬: AI 자가 평가 + 온라인 비교 + 개선 후 보고
6. 학습 축적 사이클이 핵심 비전
7. Cross-model: Codex(GPT) + Gemini 센터 활용

### 페르소나별 기여 (채택 내용)
- **오딘**: 2축 분리 (Business/System) + Tier 시스템 (A/B/C)
- **헤르메스**: output-review.py 경량 구현 + 멀티모달 이미지 평가 확인
- **프로메테우스**: TTL + source tagging + max_retry=2 + delta 검증 + 우선순위 위계
- **로키(DA)**: Pairwise comparison + Passive Feedback → rubric 병목 제거
- **아누**: TTL archive 보완 + 전체 종합

### 기각된 항목
- rubric.md 84개 선작성 → 인간 병목 (로키)
- golden-examples 84개 → Pairwise로 대체 (로키)
- 월간 학습 감사 → TTL로 대체 (로키)
- 온라인 소스를 truth로 직접 사용 → "참고"만 (로키 보안)

### 최종 합의
→ `memory/specs/skill-eval-self-learning-design.md` 참조

---

**스킬 버전**: agent-meeting v1.5
**기록자**: 아누 (개발실장)