# task-1482.1 완료 보고서: 카파시 LLM Wiki → InsuWiki 적용 심층 분석

> 팀: dev5-team (마르둑) | 작성일: 2026-04-05

---

## SCQA

**S**: Andrej Karpathy가 2026년 4월 "LLM Wiki" 패턴을 공개했다. "knowledge that accumulates, not re-derives" — RAG의 반복 재합성 대신 LLM이 마크다운 위키를 점진적으로 구축/유지하는 패턴이다. InsuWiki는 Next.js+Firebase 기반 보험 지식 위키로, 1,192개 보험 용어 시딩, AI 노드 자동 연결(정적 매칭 precision 100%), PDF 인덱싱 파이프라인, 유튜브 크롤링 파이프라인이 구현되어 있으나 본격 콘텐츠 작업은 미시작 상태이다.

**C**: InsuWiki의 현재 RAG 방식은 질의마다 원본을 재검색/재합성하는 일회성 패턴이다. 교차 참조 자동 유지, 법규 변경 시 영향 페이지 자동 갱신, 사용자 질의→지식 피드백 루프가 없어 콘텐츠 규모 확대 시 유지 부담이 가치보다 빨리 증가할 위험이 있다. 특히 보험 도메인은 월별 상품 갱신, 분기별 법규 변경으로 인해 수동 위키 유지가 비현실적이다.

**Q**: LLM Wiki 패턴을 InsuWiki의 기존 Firestore 기반 아키텍처에 적용하여, 지식이 자동으로 축적/유지되는 시스템으로 전환할 수 있는가?

**A**: **Option B (Firestore 기반 LLM Wiki)로 5 Phase 점진 도입이 최적이다.** (1) Firestore에 raw_sources 컬렉션 + wiki_index/wiki_log 메타 문서 + 보험 도메인 schema 추가, (2) 기존 pdfIndexing→wiki compiler 연결로 Ingest MVP 구축, (3) query_logs+feedback→위키 피드백 루프, (4) 7개 Lint 규칙으로 자기치유, (5) 소스 유형 확장. 기존 코드(staticMatching, embeddingMatching, ragQuery, insurance_terms 1,192건)를 100% 재활용하면서 LLM Wiki 3대 오퍼레이션(Ingest/Query/Lint)을 Firestore 위에 구현한다. 아누 시스템의 Phase 3 Progressive Disclosure 패턴은 카파시가 언급한 "4-level index token budgets"와 정확히 일치하여 직접 적용 가능하다. Gemini API 기준 월 $15-30 비용으로 운영 가능하며, 보험 정보의 법적 리스크를 고려해 "LLM 제안 + diff 리뷰 게이트" 변형을 추천한다.

---

## 산출물

- `/home/jay/workspace/memory/research/karpathy-llm-wiki-insuwiki-analysis.md` — 심층 분석 보고서 (8개 챕터, 약관/법규/유튜브 등 5개 소스 유형별 Ingest 전략, 7개 보험 특화 Lint 규칙, 5 Phase 로드맵 포함)

## 셀프 QC

- [x] 1. 다른 파일 영향: 없음 (리서치 보고서만 생성, 코드 변경 없음)
- [x] 2. 엣지 케이스: N/A (분석 작업)
- [x] 3. 작업 지시 일치: 6개 분석 요구사항 모두 커버 (현재 상태/적용 가능성/기술 방안/도메인 특화/로드맵/메모리 연결)
- [x] 4. 에러 처리/보안: N/A (코드 없음)
- [x] 5. 테스트 커버리지: N/A (코드 없음)
- [x] 6. 발견 이슈 모두 해결: 아래 참조
- [x] 7. 코드 아키텍처 원칙: N/A (코드 없음)
- [x] 8. 인터페이스 변경 문서: N/A
- [x] 9. HTML→PNG: N/A

## 발견 이슈 및 해결

### 자체 해결 (3건)
1. **InsuWiki 프로젝트 경로 불일치** — 태스크 파일에 `/home/jay/projects/InsuWiki/`(대문자)로 기재되었으나 실제 경로는 `/home/jay/projects/insuwiki/`(소문자). 분석 시 올바른 경로로 수정하여 진행.
2. **임베딩 매칭 비활성 상태 발견** — config/aiLinking에서 embeddingMatching.enabled=false. 분석 보고서에 현재 상태 명시하고, LLM Wiki 통합 시 활성화 방안 제안.
3. **Progressive Disclosure 패턴 중복** — 아누 시스템 Phase 3와 카파시 커뮤니티 "4-level index token budgets"가 거의 동일 패턴임을 발견. 보고서에 시너지 분석으로 반영.

### 범위 외 미해결 (1건)
1. **Critical 버그 6건 (task-146.1)** — insurance_metadata docId 이중 prefix 등 기존 미해결 이슈. 범위 외 사유: 별도 태스크로 관리 중.

## 모델 사용 기록
- 마르둑 (팀장): 작업 설계/분석/보고서 작성 / opus (팀장 역할)
- 엔키 (탐색 에이전트 1): InsuWiki 프로젝트 구조 상세 분석 / sonnet
- 이쉬타르 (탐색 에이전트 2): 아누 메모리 시스템 분석 / sonnet

## 머지 판단
- **머지 필요**: No
- **사유**: 코드 변경 없음 (리서치 보고서만 생성)
