# Hermes Agent 전수조사 — 학습 가능 항목 전체 리스트

**작성일:** 2026-03-23
**분석자:** dev1-team (헤르메스 팀장, 불칸/이리스 팀원)
**레포:** https://github.com/NousResearch/hermes-agent
**버전:** v0.4.0
**규모:** Python 542개 파일, 스킬 94개, 총 1,146개 파일

---

## 목차

1. [Core Agent](#1-core-agent)
2. [Memory & Learning](#2-memory--learning)
3. [Skills & Tools](#3-skills--tools)
4. [Skills 카탈로그 (전수)](#4-skills-카탈로그-전수)
5. [Security](#5-security)
6. [Infrastructure](#6-infrastructure)
7. [UX & Interface (Gateway)](#7-ux--interface-gateway)
8. [Analytics & Observability](#8-analytics--observability)
9. [Documentation, CI/CD & Configuration](#9-documentation-cicd--configuration)
10. [RL & Benchmarks](#10-rl--benchmarks)
11. [도입 권장 항목 요약](#11-도입-권장-항목-요약)

---

## 1. Core Agent

### 1.1 prompt_builder.py — 시스템 프롬프트 조립
- **기능:** 시스템 프롬프트 구성 — Identity(SOUL.md), 플랫폼 힌트, 스킬 인덱스, 컨텍스트 파일 결합
- **핵심 구현:** `_scan_context_content()` 10개 위험 패턴 + 10개 유니코드 인젝션 탐지. `.hermes.md > AGENTS.md > CLAUDE.md > .cursorrules` 우선순위. `_truncate_content()` 70% head / 20% tail / 10% marker
- **우리 대비:** 인젝션 탐지 없음, 컨텍스트 우선순위 없음, 스킬 인덱스 자동생성 없음
- **도입 가치:** **상** | 난이도: 중 | 영향: 프롬프트 빌딩 전체

### 1.2 context_compressor.py — 5단계 컨텍스트 압축
- **기능:** 컨텍스트 50% 초과 시 자동 압축
- **핵심 구현:** ① 오래된 tool result 정리 → ② head 보호 → ③ tail 20K 토큰 보호 → ④ LLM 구조화 요약(Goal/Progress/Decisions/Files/Next) → ⑤ 반복 압축 시 기존 요약 누적 업데이트 → orphan tool pair 정리
- **우리 대비:** Claude Code 내장 단순 압축만 사용. 구조화 요약, tail 보호, 반복 압축 모두 없음
- **도입 가치:** **상** | 난이도: 상 | 영향: 세션 관리 전체

### 1.3 auxiliary_client.py — 보조 LLM 라우터
- **기능:** 압축/비전/웹추출 등 보조 작업용 저렴한 모델 자동 선택
- **핵심 구현:** 6단계 fallback: OpenRouter → Nous Portal → Custom → Codex OAuth → Anthropic → Direct. 작업별 `AUXILIARY_VISION_PROVIDER` env var 오버라이드
- **우리 대비:** 단일 모델 사용 (비용 비효율)
- **도입 가치:** **상** | 난이도: 중 | 영향: 요약/분석 파이프라인

### 1.4 insights.py — 세션 인사이트 엔진
- **기능:** SQLite 기반 토큰/비용/도구 사용 패턴/활동 추세 분석
- **핵심 구현:** `InsightsEngine` 클래스. 30/7/1일 필터. ASCII 바 차트. 도구 빈도/성공률 분석
- **우리 대비:** dashboard/ 수동 단순. 비용 추정/도구 성공률 없음
- **도입 가치:** **상** | 난이도: 중 | 영향: 대시보드 확장

### 1.5 smart_model_routing.py — 키워드 기반 모델 라우팅
- **기능:** 단순 질문은 저렴한 모델로, 복잡 작업은 고성능 모델로 자동 분기
- **핵심 구현:** `max_simple_chars=160`, `max_simple_words=28`. 복잡 키워드 셋(analyze, implement 등) 체크
- **우리 대비:** task-router.py 유사하나 더 단순
- **도입 가치:** **중** | 난이도: 중

### 1.6 prompt_caching.py — 프롬프트 캐싱
- **기능:** Anthropic `system_and_3` 전략으로 API 비용 ~75% 절감
- **핵심 구현:** 시스템 프롬프트 1개 + 최근 non-system 3개에 `cache_control: {"type": "ephemeral"}` 삽입
- **우리 대비:** 없음
- **도입 가치:** **중** | 난이도: 하

### 1.7 usage_pricing.py — 비용 계산
- **기능:** 200+ 모델 가격표 기반 실시간 비용 추정
- **핵심 구현:** `CanonicalUsage`, `PricingEntry`, `CostResult` 데이터클래스. Anthropic/OpenAI/DeepSeek/Google 등
- **우리 대비:** 비용 추적 없음
- **도입 가치:** **중** | 난이도: 하

### 1.8 context_references.py — @ 참조 시스템
- **기능:** `@file:path`, `@folder:`, `@diff`, `@staged`, `@git:N`, `@url:URL` 6종 참조 파싱 후 컨텐츠 주입
- **핵심 구현:** 정규식 추출 → 50% hard / 25% soft dual-limit 컨텍스트 보호
- **우리 대비:** 없음 (GitHub Copilot/Cursor 스타일 UX)
- **도입 가치:** **중** | 난이도: 중

### 1.9 redact.py — 런타임 비밀 마스킹
- **기능:** 20+ 패턴(sk-*, ghp_*, AKIA*, Telegram 토큰, DB 연결 등) 자동 마스킹
- **핵심 구현:** `RedactingFormatter`로 Python 로거에 자동 적용
- **우리 대비:** QC-RULES.md 정책만 (런타임 처리 없음)
- **도입 가치:** **상** | 난이도: 하

### 1.10 trajectory.py — 궤적 저장
- **기능:** ShareGPT 포맷 JSONL 저장. 완료/실패 분리
- **우리 대비:** decision_logger.py 유사
- **도입 가치:** **중** | 난이도: 하

### 1.11 model_metadata.py — 모델 메타데이터
- **기능:** 9단계 resolution chain (사용자 override → models.dev API → Ollama → LM Studio → llama.cpp → vLLM → 하드코딩 → provider 기본값 → 최솟값)
- **우리 대비:** 없음. 로컬 LLM 서버 자동 감지 인상적
- **도입 가치:** **중** | 난이도: 하

### 1.12 title_generator.py — 세션 제목 자동 생성
- **기능:** 첫 2턴 후 백그라운드에서 50자 제목 생성
- **우리 대비:** 없음
- **도입 가치:** **하** | 난이도: 하

### 1.13 anthropic_adapter.py — Anthropic 어댑터
- **기능:** OpenAI-compatible → Anthropic Messages API 변환. 3종 auth (API key/OAuth/Claude Code credentials)
- **우리 대비:** Claude API 직접 호출
- **도입 가치:** **하** | 난이도: —

### 1.14 display.py — TUI 디스플레이
- **기능:** Rich 기반 kawaii 스피너, 4 내장 스킨 + 커스텀 YAML 스킨
- **우리 대비:** 없음 (텍스트만)
- **도입 가치:** **하** | 난이도: 상

### 1.15 skill_commands.py — 슬래시 커맨드 → 스킬 호출
- **기능:** CLI + Gateway 양쪽에서 재사용, 스킬 프리로드
- **우리 대비:** SKILL.md 로딩만
- **도입 가치:** **중** | 난이도: 중

### 1.16 copilot_acp_client.py — GitHub Copilot 백엔드 shim
- **기능:** JSON-RPC 2.0 over stdio로 Copilot을 Hermes 백엔드로 사용
- **우리 대비:** 없음 (Copilot 라이선스 활용 가능)
- **도입 가치:** **하** | 난이도: 중

---

## 2. Memory & Learning

### 2.1 memory_tool.py — MEMORY.md + USER.md 영구 메모리
- **기능:** 2파일 분리 메모리 (에이전트 관찰 + 사용자 정보)
- **핵심 구현:** `memory_char_limit=2200`, `user_char_limit=1375`. `§` 구분자. **Frozen Snapshot**: 세션 시작 시 고정 → prefix cache 안정화. `_scan_memory_content()` 13개 인젝션 패턴. `fcntl` 파일 잠금
- **우리 대비:** MEMORY.md만 사용, 문자 제한/Frozen Snapshot/인젝션 탐지/파일 잠금 모두 없음
- **도입 가치:** **상** | 난이도: 중

### 2.2 session_search_tool.py — FTS5 세션 검색
- **기능:** SQLite FTS5 전문 검색 + LLM 요약으로 과거 대화 리콜
- **핵심 구현:** FTS5 OR 쿼리 → 부모 세션 해석 → 중복 제거 → ~100K chars 윈도우 → Gemini Flash 10K 토큰 요약. `_truncate_around_matches()` 쿼리 중심 잘라내기
- **우리 대비:** daily/ 로그 수동 참조
- **도입 가치:** **상** | 난이도: 상

### 2.3 checkpoint_manager.py — 파일 체크포인트
- **기능:** 파일 변경 전 shadow git repo 자동 스냅샷. 롤백 지원
- **핵심 구현:** `~/.hermes/checkpoints/{sha256}` 경로. git commit으로 스냅샷
- **우리 대비:** 없음
- **도입 가치:** **중** | 난이도: 중

### 2.4 honcho_tools.py — Honcho 사용자 모델링
- **기능:** 변증법적 Q&A, 시맨틱 검색, 구조화 프로필, 세션 종료 요약
- **핵심 구현:** 비동기 writer 스레드로 Honcho API 동기화. 3종 `recall_mode`: hybrid/context/tools
- **우리 대비:** 없음 (외부 AI 메모리 SaaS)
- **도입 가치:** **중** | 난이도: 중

### 2.5 mixture_of_agents_tool.py — MoA 앙상블
- **기능:** 4 frontier 모델(claude-opus-4.6, gemini-3-pro, gpt-5.4-pro, deepseek-v3.2) 병렬 호출 → 집계
- **핵심 구현:** arXiv:2406.04692 구현. ThreadPoolExecutor 병렬
- **우리 대비:** 없음
- **도입 가치:** **중** | 난이도: 상

### 2.6 hermes_state.py — SQLite WAL 세션 저장소
- **기능:** SCHEMA_VERSION 5. sessions + messages 테이블. FTS5 가상 테이블. 비용 추적 컬럼
- **우리 대비:** 파일 기반 daily/ 로그 (검색/비용 추적 불가)
- **도입 가치:** **상** | 난이도: 상

---

## 3. Skills & Tools

### 3.1 skills_tool.py — Progressive Disclosure 스킬 관리
- **기능:** 3계층 스킬 로딩 (list → view → full). 플랫폼 호환성 필터, 조건부 활성화(fallback_for, requires)
- **핵심 구현:** `MAX_NAME_LENGTH=64`, `MAX_DESCRIPTION_LENGTH=1024`. agentskills.io 표준 호환
- **우리 대비:** 단번에 전체 로드 (비효율)
- **도입 가치:** **상** | 난이도: 중

### 3.2 skill_manager_tool.py — 스킬 CRUD
- **기능:** create/edit/patch/delete/write_file/remove_file. 원자적 파일 쓰기, 경로 탐색 공격 방지
- **우리 대비:** skill-creator 스킬 유사
- **도입 가치:** **중** | 난이도: 중

### 3.3 skills_guard.py — 스킬 보안 스캔
- **기능:** AST 기반 정적 분석. 실행 전 위험 패턴 탐지/차단
- **우리 대비:** 없음 (스킬 생태계 보안 핵심)
- **도입 가치:** **상** | 난이도: 상

### 3.4 skills_hub.py — agentskills.io 연동
- **기능:** GitHub API 기반 외부 스킬 저장소. PAT/gh CLI/GitHub App 3종 인증. 검역 디렉토리, 감사 로그
- **우리 대비:** 내부 스킬만
- **도입 가치:** **중** | 난이도: 중

### 3.5 delegate_tool.py — 서브에이전트 위임
- **기능:** 격리 컨텍스트 자식 AIAgent 스폰. `MAX_CONCURRENT_CHILDREN=3`, `MAX_DEPTH=2`
- **핵심 구현:** `DELEGATE_BLOCKED_TOOLS`: delegate, clarify, memory, send_message, execute_code 차단. ThreadPoolExecutor 병렬
- **우리 대비:** dispatch.py 순차 위임. 깊이 제한/차단 도구 없음
- **도입 가치:** **상** | 난이도: 상

### 3.6 registry.py — 도구 레지스트리
- **기능:** 선언적 자기 등록 패턴. `check_fn` 런타임 가용성 확인
- **우리 대비:** 직접 import (느슨한 결합 없음)
- **도입 가치:** **중** | 난이도: 중

### 3.7 approval.py — 위험 명령 승인
- **기능:** rm -rf, DROP TABLE, curl|bash 등 감지 → SmartApproval (LLM 위험도 판단 후 자동/수동 승인)
- **우리 대비:** QC-RULES.md 정책만 (런타임 없음)
- **도입 가치:** **상** | 난이도: 중

### 3.8 todo_tool.py — 인메모리 태스크 목록
- **우리 대비:** task-timer.py 유사
- **도입 가치:** **하**

### 3.9 clarify_tool.py — 명확화 전용 도구
- **우리 대비:** swing-clarify 스킬 유사하나 런타임 도구로 구현
- **도입 가치:** **중** | 난이도: 하

### 3.10 web_tools.py — 웹 검색/추출
- **우리 대비:** web_search, web_fetch 유사. Firecrawl/Tavily 플러거블 백엔드가 차이
- **도입 가치:** **하**

### 3.11 browser_tool.py — 브라우저 자동화
- **핵심 구현:** accessibility tree(ariaSnapshot) 기반. ref selector. browser_use/browserbase 프로바이더
- **우리 대비:** OpenClaw Browser 유사
- **도입 가치:** **하**

### 3.12 terminal_tool.py — 터미널 실행
- **핵심 구현:** 6환경 팩토리 (local/Docker/Modal/Singularity/SSH/Daytona)
- **우리 대비:** 로컬 쉘만
- **도입 가치:** **중** | 난이도: 상

### 3.13 file_operations.py / file_tools.py — 파일 작업
- **우리 대비:** 유사. 원자적 쓰기(temp+fsync+replace) 패턴이 차이
- **도입 가치:** **하**

### 3.14 mcp_tool.py — MCP 통합
- **핵심 구현:** 전용 백그라운드 이벤트 루프. 지수 백오프 재연결. MCP sampling + OAuth
- **우리 대비:** mcporter 유사
- **도입 가치:** **하**

### 3.15~3.25 기타 도구 (가치 하)
- `send_message_tool.py` (10+ 플랫폼 전송) — 우리 message 유사
- `vision_tools.py` — 우리 image 유사
- `tts_tool.py` (Edge/ElevenLabs/OpenAI/NeuTTS 4종) — 우리 tts 유사
- `transcription_tools.py` (Faster Whisper STT) — 없음, **도입 가치: 중**
- `voice_mode.py` (실시간 음성 대화) — 없음, 도입 가치: 하
- `code_execution_tool.py` (Python 샌드박스) — 없음, **도입 가치: 중**
- `image_generation_tool.py` (FAL 기반) — 없음, 도입 가치: 하
- `homeassistant_tool.py` (스마트 홈) — 없음, 도입 가치: 하
- `fuzzy_match.py` (Levenshtein) — 없음, **도입 가치: 중**
- `patch_parser.py` (unified diff 파싱/적용/롤백) — 없음, **도입 가치: 중**
- `process_registry.py` — 우리 process 유사, 도입 가치: 하
- `cronjob_tools.py` — 우리 cron 유사. `_CRON_THREAT_PATTERNS` 보안 스캔 내장이 차이
- `openrouter_client.py` — 없음, 도입 가치: 하
- `debug_helpers.py` — 개발 도구, 도입 가치: 하
- `interrupt.py` — 장시간 실행 중단 메커니즘, **도입 가치: 중**

### 3.26 utils.py — 원자적 파일 쓰기 패턴
- **기능:** `atomic_json_write()` / `atomic_yaml_write()` — temp + fsync + os.replace
- **핵심 구현:** `BaseException` catch로 KeyboardInterrupt에도 temp 파일 정리. `os.replace`의 POSIX 원자성
- **우리 대비:** 일반 `open().write()` 사용. 프로세스 중단 시 파일 손상 가능
- **도입 가치:** **중** | 난이도: 하 | 즉시 적용 가능

---

## 4. Skills 카탈로그 (전수)

### 4.1 apple/ (4개) — macOS 전용
- `apple-notes`: memo CLI + iCloud 동기화
- `apple-reminders`: remindctl CLI
- `findmy`: AppleScript + screencapture + vision_analyze (GUI → 비전LLM 파싱 패턴, **독창적**)
- `imessage`: imsg CLI, 2단계 안전장치
- **우리 대비:** 없음 (macOS 전용, 도입 불필요)
- **도입 가치:** **하**

### 4.2 autonomous-ai-agents/ (4개) — 에이전트 오케스트레이션
- `claude-code`: Claude Code CLI 위임 (PR 리뷰용 git worktree 패턴)
- `codex`: OpenAI Codex CLI 위임 (병렬 worktree → PR 자동 생성)
- `hermes-agent`: 자기 인스턴스를 서브프로세스 스폰 (tmux `send-keys` 워크어라운드 문서화)
- `opencode`: OpenCode TUI 오케스트레이션
- **우리 대비:** codex 스킬 있음. 자기 참조적 hermes-agent spawning은 **독창적**
- **도입 가치:** **하** (이미 있음)

### 4.3 creative/ (3개)
- `ascii-art`: pyfiglet/cowsay/boxes/toilet + REST API fallback (6도구 상황별 선택)
- `ascii-video`: 영상 → ASCII 동영상
- `excalidraw`: Excalidraw JSON 직접 생성
- **우리 대비:** canvas-design 스킬 대응
- **도입 가치:** **하**

### 4.4 data-science/ (1개)
- `jupyter-live-kernel`: jupyter_client로 살아있는 커널에 코드 실행 + nbformat 노트북 조작
- **우리 대비:** 없음
- **도입 가치:** **중** (데이터 분석 작업 시)

### 4.5 diagramming/ (구조만)
- 다이어그램 관련 스킬 카테고리
- **도입 가치:** **하**

### 4.6 dogfood/ (2개) — 자기 개선 메타스킬
- `dogfood`: Hermes 자체를 매일 사용하며 이슈 자동 GitHub 등록. `references/issue-taxonomy.md` + 리포트 템플릿
- `hermes-agent-setup`: 초기 설정 wizard
- **우리 대비:** 없음 (**자기 개선 루프의 스킬화 — 참고 가치 높음**)
- **도입 가치:** **중** (dogfood 패턴)

### 4.7 email/ (1개)
- `himalaya`: Rust 기반 터미널 이메일 (IMAP/SMTP)
- **도입 가치:** **하**

### 4.8 feeds/ (구조만)
- RSS/Atom 피드 관련
- **도입 가치:** **하**

### 4.9 gaming/ (2개) — 극단적 에이전트 사례
- `minecraft-modpack-server`: CurseForge/Modrinth 서버 구축 자동화
- `pokemon-player`: PyBoy 에뮬레이터로 Pokemon 자율 플레이 (RAM 게임 상태 읽기)
- **우리 대비:** 없음 (에이전트 루프의 극단적 적용, 참고용)
- **도입 가치:** **하**

### 4.10 github/ (6개) — GitHub 통합
- `codebase-inspection`: pygount LOC/언어 분석
- `github-auth`: 환경 감지 → 최적 인증 자동 선택
- `github-code-review`: git diff + gh CLI 인라인 코멘트 (curl fallback)
- `github-issues`: Issues CRUD
- `github-pr-workflow`: PR 전체 생명주기 + **CI 실패 자동 수정 후 재푸시 패턴**
- `github-repo-management`: 레포/릴리즈/시크릿/워크플로우 관리
- **우리 대비:** 없음 (개별 gh 명령은 사용하나 스킬화 안 됨)
- **도입 가치:** **중** (특히 github-pr-workflow의 CI 자동 수정)

### 4.11 inference-sh/ (1개)
- `inference-sh-cli`: 150+ AI 앱 실행 (FLUX, Veo, Seedream 등), 클라우드 GPU, API 키 불필요
- **도입 가치:** **하**

### 4.12 leisure/ (1개)
- `find-nearby`: OpenStreetMap Overpass API, API 키 불필요, Telegram 위치 핀 파싱
- **도입 가치:** **하**

### 4.13 mcp/ (2개)
- `mcporter`: MCP 서버 CLI (npx)
- `native-mcp`: 내장 MCP 클라이언트 — MCP 서버 툴이 네이티브 툴처럼 자동 주입. **확장성 핵심 메커니즘**
- **우리 대비:** 없음
- **도입 가치:** **상** (native-mcp 패턴)

### 4.14 media/ (4개)
- `gif-search`: Tenor GIF 검색 (curl+jq만)
- `heartmula`: HeartMuLa 3B/7B 노래 생성 (Apache-2.0)
- `songsee`: 오디오 스펙트로그램 시각화
- `youtube-content`: YouTube 트랜스크립트 → 블로그/스레드/요약 변환
- **우리 대비:** 없음
- **도입 가치:** **하** (youtube-content는 **중** — 콘텐츠 리퍼포징)

### 4.15 mlops/ (7 서브카테고리, 35+ 스킬) — ML 특화 최대 스킬 그룹
- **cloud/** (2): lambda-labs-gpu-cloud, modal-serverless-gpu
- **evaluation/** (5): huggingface-tokenizers, evaluating-llms-harness(60+ 벤치마크), nemo-curator, sparse-autoencoder-training, weights-and-biases
- **inference/** (8): gguf-quantization, guidance(constrained gen), instructor(Pydantic 검증), llama-cpp, obliteratus(거부 행동 제거), outlines(구조화 생성), tensorrt-llm, serving-llms-vllm
- **models/** (6): audiocraft, clip, llava, segment-anything, stable-diffusion, whisper
- **research/** (1): dspy(자동 프롬프트 최적화)
- **training/** (13): accelerate, axolotl, flash-attention, grpo-rl, hermes-atropos-environments, peft, pytorch-fsdp, pytorch-lightning, simpo, slime-rl, torchtitan, trl, unsloth
- **vector-databases/** (4): chroma, faiss, pinecone, qdrant
- **hub/** (1): huggingface-hub
- **우리 대비:** 없음 (전체 ML 파이프라인. 우리는 콘텐츠/마케팅 특화)
- **도입 가치:** **하** (ML 인프라 불필요. 참고만)

### 4.16 note-taking/ (1개)
- `obsidian`: Obsidian 볼트 CRUD (`OBSIDIAN_VAULT_PATH` env)
- **도입 가치:** **하**

### 4.17 productivity/ (5개)
- `google-workspace`: Gmail/Calendar/Drive/Sheets/Docs/Contacts Python OAuth2
- `linear`: Linear 이슈/프로젝트 GraphQL API (curl만, 의존성 제로)
- `nano-pdf`: 자연어 PDF 편집
- `notion`: Notion REST API CRUD
- `ocr-and-documents`: pymupdf(텍스트)/marker-pdf(OCR)/python-docx 타입별 최적 도구 선택
- `powerpoint`: markitdown(읽기)/pptxgenjs(생성)/python-pptx(편집) 3도구
- **우리 대비:** pdf 스킬, docx 스킬 있음. Google Workspace/Notion 없음
- **도입 가치:** **하** (대부분 이미 있거나 불필요)

### 4.18 research/ (7개)
- `arxiv`: arXiv REST API
- `blogwatcher`: RSS/Atom 피드 모니터링 + 읽음 상태 추적
- `domain-intel`: 도메인 수동 정찰 (서브도메인/SSL/WHOIS/DNS), stdlib만
- `duckduckgo-search`: ddgs CLI (`fallback_for_toolsets: [web]` 메타데이터로 자동 폴백)
- `ml-paper-writing`: NeurIPS/ICML/ICLR LaTeX 논문 작성, 학회별 리뷰어 가이드라인
- `parallel-cli`: Parallel CLI 네이티브 웹 검색
- `polymarket`: 예측 시장 데이터 (read-only)
- **우리 대비:** research/cross-verified-research 스킬 있음. `fallback_for_toolsets` **메타데이터 패턴 주목**
- **도입 가치:** **하** (이미 있음. `fallback_for` 패턴은 **중**)

### 4.19 smart-home/ (1개)
- `openhue`: Philips Hue 조명 제어
- **도입 가치:** **하**

### 4.20 social-media/ (1개)
- `xitter`: X(Twitter) CRUD (`x-cli`)
- **도입 가치:** **하**

### 4.21 software-development/ (7개) — 개발 방법론 스킬
- `code-review`: Security First 체크리스트
- `plan`: `.hermes/plans/` 자동 계획 저장
- `requesting-code-review`: 2단계 리뷰 (스펙 → 코드) 워크플로
- `subagent-driven-development`: delegate_task 병렬 실행 + 2단계 리뷰 (적응형 패턴)
- `systematic-debugging`: 4단계 근본원인 조사 (수정보다 이해 우선)
- `test-driven-development`: RED-GREEN-REFACTOR 강제
- `writing-plans`: 정확한 파일경로 + 완전한 코드 예시 포함 계획
- **우리 대비:** systematic-debugging, subagent-driven-development **동일 이름 스킬 보유** (obra/superpowers 공통 원천)
- **도입 가치:** **하** (이미 있음)

### 4.22 optional-skills/ (15개) — 확장 스킬
- `blackbox` (AI 코딩): 멀티 LLM + judge 패턴 — **여러 모델 결과 자동 비교가 독창적**
- `base`, `solana` (블록체인): RPC + CoinGecko
- `blender-mcp` (3D): 소켓 제어
- `meme-generation`: Pillow 텍스트 오버레이
- `agentmail`: 에이전트 전용 이메일 인박스
- `neuroskill-bci` (**뇌파 연동**): Muse 2/S/OpenBCI 웨어러블 40+ EXG 점수 — **극히 독창적**
- `fastmcp`: Python MCP 서버 빌드
- `openclaw-migration`: 경쟁 에이전트 사용자 데이터 이전 — **유저 확보 전략**
- `telephony`: Twilio SMS + Bland.ai/Vapi AI 통화
- `bioinformatics`: 400+ 바이오 스킬 게이트웨이 — **메타스킬 패턴 (스킬이 스킬 컬렉션 인덱싱)**
- `qmd`: BM25 + 벡터 검색 + LLM 리랭킹 로컬 RAG
- `1password`: 시크릿 주입
- `oss-forensics`: GitHub 공급망 포렌식 (삭제 커밋 복구, force-push 감지)
- `sherlock`: 400+ SNS 사용자명 OSINT
- **우리 대비:** 모두 없음. **bioinformatics의 메타스킬 패턴**과 **blackbox의 judge 패턴** 참고 가치
- **도입 가치:** **하** (대부분 특수 목적. 메타스킬 패턴은 **중**)

---

## 5. Security

### 5.1 tirith_security.py — 사전 실행 보안 스캔
- **기능:** 호모그래프 URL, 파이프-투-인터프리터, 터미널 인젝션 탐지
- **핵심 구현:** Tirith 전용 바이너리. Exit code 0/1/2. SHA-256 체크섬 + cosign 증명 검증. GitHub Actions 워크플로우 서명 검증
- **우리 대비:** 없음 (가장 큰 보안 격차)
- **도입 가치:** **상** | 난이도: 상

### 5.2 website_policy.py — robots.txt/ToS 준수
- **기능:** 웹 크롤링 시 자동 정책 준수
- **우리 대비:** 없음
- **도입 가치:** **중** | 난이도: 하

### 5.3 보안 패턴 요약 (코드 전반)
- `prompt_builder.py`: 10 위험 패턴 + 10 유니코드 인젝션 → 컨텍스트 로드 거부
- `memory_tool.py`: 13 인젝션/유출 패턴 → 메모리 저장 차단
- `redact.py`: 20+ 민감 정보 패턴 → 로거 자동 마스킹
- `approval.py`: SmartApproval LLM 위험도 판단 → 자동/수동 승인
- `skills_guard.py`: AST 정적 분석 → 스킬 실행 전 차단
- `tirith_security.py`: 전용 바이너리 → 명령 실행 전 스캔
- `cronjob_tools.py`: `_CRON_THREAT_PATTERNS` → 크론 프롬프트 보안 스캔
- **총평:** Hermes는 **6개 레이어 보안 심층 방어**. 우리는 QC-RULES.md 정책 문서 1개

---

## 6. Infrastructure

### 6.1 environments/ — 실행 환경
- `base.py`: `BaseEnvironment` ABC — execute/cleanup 추상. 우리에게 없는 환경 추상화
- `local.py`: subprocess + PTY — 우리 exec 유사
- `docker.py`: cap-drop ALL, no-new-privileges, PID 제한 — 격리 실행
- `ssh.py`: paramiko + ControlMaster 연결 재사용 — 원격 실행
- `modal.py`: Modal 서버리스 — 클라우드 실행
- `singularity.py`: HPC 컨테이너
- `daytona.py`: 클라우드 개발 환경
- `persistent_shell.py`: PTY 프로세스로 셸 상태(CWD, env var) 유지 — **중요: multi-step 작업에 필수**
- **도입 가치:** persistent_shell **중**, Docker **중**, 나머지 **하**

### 6.2 tool_call_parsers/ — 11개 모델별 파서
- hermes, deepseek_v3, deepseek_v3_1, qwen, qwen3_coder, kimi_k2, glm45, glm47, llama, mistral, longcat
- **기능:** 비표준 tool call 형식(`<tool_call>` XML 등)을 통일 형식으로 파싱
- **우리 대비:** Anthropic만 사용하므로 불필요
- **도입 가치:** **하**

### 6.3 model_tools.py — 도구 오케스트레이션 레이어
- **핵심 구현:** 영속적 이벤트 루프 패턴(`asyncio.new_event_loop` 재사용) → `Event loop is closed` 방지
- **도입 가치:** **중** (asyncio 패턴 참고)

### 6.4 toolsets.py — 도구 논리 그룹
- **기능:** web, terminal, file, browser 등 toolset 단위 on/off
- **우리 대비:** 도구 분류 없음
- **도입 가치:** **중**

---

## 7. UX & Interface (Gateway)

### 7.1 게이트웨이 아키텍처 — 14개 플랫폼
- `BasePlatformAdapter`: 추상 기반. `MessageEvent` 데이터클래스. 미디어 로컬 캐시(URL 만료 대응)
- **플랫폼 어댑터 전수:**
  - `telegram.py`: python-telegram-bot
  - `discord.py`: discord.py
  - `whatsapp.py`: WhatsApp Business API / whatsapp-web.js / Baileys
  - `slack.py`: slack-bolt + Socket Mode
  - `signal.py`: signal-cli HTTP 데몬 (SSE + JSON-RPC)
  - `matrix.py`: matrix-nio (E2EE 선택적)
  - `email.py`: IMAP + SMTP 폴링
  - `sms.py`: Twilio REST API + aiohttp 웹훅
  - `dingtalk.py`: DingTalk Stream Mode SDK
  - `homeassistant.py`: HA WebSocket (상태 변화 → 에이전트)
  - `mattermost.py`: REST API v4 + WebSocket
  - `webhook.py`: 범용 웹훅 (HMAC, 속도제한, 멱등성, GitHub/Stripe/JIRA)
  - `api_server.py`: **OpenAI 호환 /v1/chat/completions + /v1/responses** — Open WebUI/LobeChat/LibreChat 등 연결 가능
- **우리 대비:** Telegram 단일 플랫폼. api_server.py의 **OpenAI 호환 어댑터**가 특히 주목
- **도입 가치:** 전체 **중**, api_server **상** (어떤 프론트엔드도 연결 가능)

### 7.2 게이트웨이 지원 모듈
- `config.py`: 환경변수 파싱
- `session.py`: PII 해싱, 세션 키 빌더
- `delivery.py`: 메시지 라우팅 (`"telegram:123456"`, `"origin"`, `"local"`)
- `channel_directory.py`: 5분마다 채널 인덱스 갱신 → send_message 채널명→ID 해석
- `hooks.py`: **이벤트 훅 시스템** — `~/.hermes/hooks/` 디렉토리. HOOK.yaml + handler.py. gateway:startup, agent:start/end, session:start/end, command:\* 이벤트
- `mirror.py`: 크로스 플랫폼 세션 미러링 (JSONL + SQLite)
- `stream_consumer.py`: 스트리밍 메시지 소비
- `sticker_cache.py`: 스티커 캐시
- `pairing.py`: 크로스 플랫폼 페어링
- **주목:** `hooks.py`의 **이벤트 훅 시스템** — 외부 자동화 통합 포인트
- **도입 가치:** hooks.py **상**, 나머지 **하**

### 7.3 cron/ — 스케줄링
- `scheduler.py`: `tick()` 60초마다, `fcntl` 파일 잠금, `SILENT_MARKER=[SILENT]` 빈 출력 억제
- `jobs.py`: jobs.json, croniter, one-shot, 출력 파일 0600 권한
- **우리 대비:** cokacdir cron 유사. 파일 잠금/SILENT_MARKER는 없음
- **도입 가치:** **중** (파일 잠금 + SILENT 패턴)

---

## 8. Analytics & Observability

### 8.1 insights.py (Core Agent 1.4 참조)
- **핵심:** 토큰 소비, 비용 추정, 도구 사용 패턴, 활동 트렌드, ASCII 차트
- **도입 가치:** **상**

### 8.2 usage_pricing.py (Core Agent 1.7 참조)
- **핵심:** 200+ 모델 가격표 기반 실시간 비용 계산
- **도입 가치:** **중**

---

## 9. Documentation, CI/CD & Configuration

### 9.1 docs/
- `skins/`: 에이전트 페르소나 정의 (동일 엔진에 다른 성격 적용)
- `migration/openclaw.md`: 경쟁 에이전트에서 이전 가이드
- `plans/`: 기능 계획 문서
- **도입 가치:** **하** (참고용 구조)

### 9.2 .github/ — CI/CD
- GitHub Actions: pytest + pyright 자동 실행, PR 체크
- ISSUE_TEMPLATE: 버그/기능요청 템플릿
- **우리 대비:** CI/CD 없음
- **도입 가치:** **중** (자동화된 품질 게이트)

### 9.3 tests/ — 테스트 구조
- `fakes/`: 플랫폼 어댑터/LLM 클라이언트 Mock (Fake 패턴으로 의존성 역전)
- 디렉토리별 분리: acp, agent, cron, gateway, hermes_cli, honcho, integration, skills, tools
- **우리 대비:** pytest + pyright만, fakes 없음
- **도입 가치:** **중** (Fake 패턴)

### 9.4 cli-config.yaml.example — 단일 YAML 설정 중앙화
- **기능:** 모델/프로바이더, smart_model_routing, worktree 기본값, display 4단계, PII 마스킹, 스킨
- **우리 대비:** 분산 설정 (env, 코드)
- **도입 가치:** **상** | 난이도: 중

### 9.5 pyproject.toml — 선택적 의존성 그룹 패턴
- 15개 optional deps 그룹: `pip install hermes-agent[rl,voice]`
- **우리 대비:** 단일 requirements.txt
- **도입 가치:** **중** | 난이도: 하

### 9.6 website/ & landingpage/
- Docusaurus v3 문서 사이트 + 마케팅 랜딩 페이지
- **우리 대비:** 없음
- **도입 가치:** **하**

### 9.7 scripts/
- `install.sh`: curl-pipe 원클릭 설치 (uv, Python, venv, wizard)
- `whatsapp-bridge/`: WhatsApp 브리지 Node.js
- **도입 가치:** **하**

---

## 10. RL & Benchmarks

### 10.1 RL 인프라 (Nous Research 자체)
- `rl_training_tool.py`: Tinker-Atropos 기반 RL 실행. AST 스캔 환경 발견. LOCKED_FIELDS. WandB 메트릭
- `trajectory.py` + `trajectory_compressor.py`: 궤적 수집/압축
- `batch_runner.py`: multiprocessing.Pool 배치 실행. 체크포인팅/재개. HF 스키마
- `rl_cli.py`: RL CLI (30분 체크 인터벌)
- `toolset_distributions.py`: RL 데이터 생성 시 툴셋별 확률적 샘플링
- `datagen-config-examples/`: RL 합성 데이터 생성 설정
- `tinker-atropos/`: Atropos RL 프레임워크 연동 실험
- **우리 대비:** 없음 (Nous Research 고유 인프라)
- **도입 가치:** **하** (RL 파이프라인 불필요)

### 10.2 Benchmarks & Environments
- `environments/agent_loop.py`: 재사용 멀티턴 에이전트 루프 (128 워커 ThreadPoolExecutor)
- `environments/benchmarks/terminalbench_2/`: Terminal-Bench 2.0 평가 (Docker + Modal)
- `environments/benchmarks/tblite/`: TBLite 평가
- `environments/benchmarks/yc_bench/`: YC Bench 평가
- `environments/hermes_swe_env/`: SWE-Bench RL 환경
- `mini-swe-agent/`: mini SWE 에이전트 실행 + Hermes 궤적 출력
- `mini_swe_runner.py`: `TERMINAL_TOOL_DEFINITION` XML 형식 생성
- `minisweagent_path.py`: git worktree 환경에서 mini-swe-agent/src 경로 발견
- **도입 가치:** **하** (벤치마크 인프라)

### 10.3 ACP 어댑터
- `acp_adapter/`: Hermes를 ACP 서버로 노출 (IDE/다른 도구가 호출 가능)
- `acp_registry/agent.json`: 표준 프로토콜 디스크립터
- **도입 가치:** **하**

### 10.4 honcho_integration/
- `client.py`: Honcho AI 메모리 서비스 초기화. 3종 recall_mode
- `session.py`: 비동기 writer 스레드, 로컬 캐시
- **도입 가치:** **중**

---

## 11. 도입 권장 항목 요약

### 가치 '상' 항목 (15개) — 우선 도입 권장

| # | 항목 | 파일 | 카테고리 | 난이도 | 핵심 이유 |
|---|------|------|---------|-------|---------|
| 1 | 프롬프트 인젝션 탐지 | prompt_builder.py | Security | 중 | 10 패턴 + 유니코드 탐지, 모든 컨텍스트 로드에 적용 |
| 2 | 5단계 컨텍스트 압축 | context_compressor.py | Core Agent | 상 | Goal/Progress/Decisions 구조화 요약, 반복 압축 |
| 3 | 보조 LLM 라우터 | auxiliary_client.py | Core Agent | 중 | 6단계 fallback, 보조 작업 비용 대폭 절감 |
| 4 | 세션 인사이트 엔진 | insights.py | Analytics | 중 | 비용/도구 패턴/트렌드 분석, 대시보드 확장 |
| 5 | 런타임 비밀 마스킹 | redact.py | Security | 하 | 20+ 패턴, 로거 자동 적용 — 즉시 도입 가능 |
| 6 | Frozen Snapshot 메모리 | memory_tool.py | Memory | 중 | 캐시 안정화 + 인젝션 탐지 + 파일 잠금 |
| 7 | FTS5 세션 검색 | session_search_tool.py | Memory | 상 | 과거 대화 리콜 + LLM 요약 |
| 8 | SQLite WAL 세션 저장소 | hermes_state.py | Memory | 상 | FTS5 인덱스 + 비용 추적, 파일 로그 대체 |
| 9 | Progressive Disclosure 스킬 | skills_tool.py | Skills | 중 | 3계층 로딩 + 조건부 활성화 |
| 10 | 스킬 보안 스캔 | skills_guard.py | Security | 상 | AST 정적 분석, 외부 스킬 차단 |
| 11 | 서브에이전트 격리 위임 | delegate_tool.py | Skills | 상 | 깊이 제한 + 차단 도구 + 병렬 |
| 12 | 사전 실행 보안 스캔 | tirith_security.py | Security | 상 | Tirith 바이너리 + cosign 검증 |
| 13 | 위험 명령 승인 | approval.py | Security | 중 | SmartApproval LLM 자동 위험도 판단 |
| 14 | 단일 YAML 설정 중앙화 | cli-config.yaml | Config | 중 | 분산 설정 통합, PII 마스킹, worktree 기본값 |
| 15 | OpenAI 호환 API 서버 | gateway/api_server.py | UX | 중 | /v1/chat/completions 엔드포인트로 어떤 프론트엔드 연결 |

### 가치 '중' 항목 (25개) — 2차 도입 검토

| # | 항목 | 카테고리 | 난이도 |
|---|------|---------|-------|
| 1 | 원자적 파일 쓰기 (utils.py) | Infrastructure | 하 |
| 2 | Prompt Caching system_and_3 | Core Agent | 하 |
| 3 | 스마트 모델 라우팅 | Core Agent | 중 |
| 4 | 비용 계산 200+ 모델 | Analytics | 하 |
| 5 | @ 참조 시스템 | UX | 중 |
| 6 | 모델 메타데이터 9단계 resolution | Core Agent | 하 |
| 7 | 스킬 YAML frontmatter 파싱 | Skills | 중 |
| 8 | 체크포인트 관리 | Memory | 중 |
| 9 | Honcho 사용자 모델링 | Memory | 중 |
| 10 | MoA 앙상블 | Memory | 상 |
| 11 | 스킬 CRUD 도구 | Skills | 중 |
| 12 | 스킬 허브 연동 | Skills | 중 |
| 13 | 도구 레지스트리 패턴 | Skills | 중 |
| 14 | 터미널 다중 환경 | Infrastructure | 상 |
| 15 | 코드 실행 샌드박스 | Tools | 중 |
| 16 | STT (Faster Whisper) | Tools | 중 |
| 17 | 명확화 도구 | Tools | 하 |
| 18 | 퍼지 매칭 | Tools | 하 |
| 19 | 패치 파서 | Tools | 중 |
| 20 | 인터럽트 메커니즘 | Tools | 중 |
| 21 | robots.txt 정책 | Security | 하 |
| 22 | Persistent Shell (상태유지 셸) | Infrastructure | 중 |
| 23 | 이벤트 훅 시스템 (hooks.py) | UX | 중 |
| 24 | CI/CD (GitHub Actions) | DevOps | 중 |
| 25 | Fake 테스트 패턴 | Testing | 중 |

### 가치 '하' 항목 (전수 — 57개)

**이미 있음 (16):** web_tools, browser_tool, file_operations, mcp_tool, tts_tool, vision_tools, send_message, process_registry, cronjob_tools, todo_tool, codex 스킬, systematic-debugging 스킬, subagent-driven-development 스킬, code-review 스킬, plan 스킬, exec

**특수 목적 (22):** RL tools(5), voice_mode, homeassistant, ACP adapter(9파일), Singularity/Daytona/Modal 환경, tool_call_parsers(11), title_generator, display.py, copilot_acp_client, anthropic_adapter, skills_sync

**도메인 특화 스킬 (19):** apple/(4), gaming/(2), mlops/(35+ — ML 파이프라인), smart-home, leisure, email, social-media, inference-sh, creative/(3), note-taking, website/landingpage, scripts/

---

## 총 정리

| 카테고리 | 분석 항목 수 | 가치 상 | 가치 중 | 가치 하 |
|---------|------------|--------|--------|--------|
| Core Agent (agent/) | 16 | 5 | 6 | 5 |
| Memory & Learning | 6 | 3 | 2 | 1 |
| Skills & Tools (tools/) | 26 | 3 | 10 | 13 |
| Skills 카탈로그 (skills/) | 94 | 1 | 4 | 89 |
| Security | 7 | 4 | 1 | 2 |
| Infrastructure | 12 | 0 | 4 | 8 |
| UX/Gateway | 17 | 2 | 2 | 13 |
| Analytics | 2 | 1 | 1 | 0 |
| Docs/CI/Config | 7 | 1 | 3 | 3 |
| RL/Benchmarks | 10 | 0 | 0 | 10 |
| **총계** | **197** | **20** | **33** | **144** |

### 1차 분석(아누 5건) 대비 추가 발견

아누의 1차 분석(5건)에서 다루지 않은 **가치 '상' 추가 발견 15건:**
1. 보조 LLM 라우터 (비용 최적화)
2. 세션 인사이트 엔진 (사용량 분석)
3. SQLite WAL 세션 저장소 (FTS5 + 비용)
4. Progressive Disclosure 스킬 (3계층 로딩)
5. 스킬 보안 스캔 (AST 정적 분석)
6. 서브에이전트 격리 위임 (깊이 제한 + 차단)
7. 사전 실행 보안 스캔 (Tirith + cosign)
8. 위험 명령 승인 (SmartApproval)
9. 단일 YAML 설정 중앙화
10. OpenAI 호환 API 서버
11. 프롬프트 인젝션 탐지 (prompt_builder.py) — 아누 "메모리 보안 스캔"에서 일부 다뤘으나 prompt_builder 별도
12. Frozen Snapshot 패턴 — 아누 미언급
13. 런타임 비밀 마스킹 (redact.py) — 아누 미언급
14. 이벤트 훅 시스템 (hooks.py) — 아누 미언급
15. 원자적 파일 쓰기 패턴 — 아누 미언급

### 독창적 패턴 (참고용)
- `findmy` 스킬: GUI 앱을 AppleScript + screencapture + vision LLM으로 파싱
- `neuroskill-bci`: BCI 웨어러블 인지 상태 → 에이전트 응답 조정
- `hermes-agent spawning`: 자기 인스턴스 서브프로세스 스폰 + tmux 워크어라운드
- `obliteratus`: mechanistic interpretability 기반 LLM 거부 행동 제거
- `pokemon-player`: headless 에뮬레이터 자율 게임 플레이
- `openclaw-migration`: 경쟁 에이전트 사용자 데이터 자동 이전 (유저 확보 전략)
- `bioinformatics` 메타스킬: 스킬이 400+ 스킬 컬렉션을 인덱싱
- `blackbox` judge 패턴: 멀티 LLM 실행 후 최적 결과 자동 선택

---

**작성 완료일:** 2026-03-23
**분석자:** dev1-team (헤르메스 팀장, 불칸 백엔드, 이리스 프론트엔드)
**총 분석 항목:** 197개 (agent/ 16 + tools/ 26 + skills/ 94 + security 7 + infra 12 + gateway 17 + analytics 2 + docs 7 + RL 10 + 기타 6)