# plan-task-137.1: InsuWiki 유튜브 3-Layer 요약 파이프라인 3문서 작성

## 작업 개요
- 작업 ID: task-137.1
- 팀: dev1-team (헤르메스 팀장)
- 목표: 유튜브 콘텐츠에 대한 3-Layer 요약 파이프라인 설계 문서 3종 작성 (코딩 아님)
  - 계획서 (Plan)
  - 맥락노트 (Context Note)
  - 체크리스트 (Checklist)

## 배경
- 현재 3-Layer 요약 시스템은 보험약관 PDF에만 적용 (Level 1: 핵심요약, Level 2: 섹션요약, Level 3: 원문청크)
- 유튜브 파이프라인은 별도의 6섹션 Gemini 요약 형식으로 동작 중 (crawlYoutubeChannels.ts)
- 유튜브 콘텐츠에도 3-Layer 개념을 확장 적용하여 일관된 요약 체계를 구축해야 함

---

## 서브태스크 분해 및 팀원 배정

### 서브태스크 1: 계획서 작성 (담당: 불칸)
- 유튜브 3-Layer 파이프라인의 기술 아키텍처 설계
- 기존 약관 3-Layer와의 공통점/차이점 분석
- Firestore 컬렉션 설계 (youtube_summaries 또는 기존 컬렉션 확장)
- 파이프라인 흐름도: 크롤링 → 자막추출 → 청킹 → Level 3 → Level 2 → Level 1
- 프롬프트 설계 방향 (유튜브 도메인 특화)

### 서브태스크 2: 맥락노트 작성 (담당: 아테나)
- 프로젝트 배경 및 동기
- 현재 시스템 현황 (약관 3-Layer + 유튜브 6섹션)
- 의존성 및 제약사항 (4순위 권위, 단독인용 금지 등)
- 아키텍처 결정 사항 및 기각된 대안
- 용어 정의 및 레퍼런스

### 서브태스크 3: 체크리스트 작성 (담당: 아르고스)
- 구현 전 체크리스트 (환경/인프라 확인 항목)
- 개발 단계별 체크리스트 (Phase별 구현 항목)
- QA 체크리스트 (테스트/검증 항목)
- 배포 체크리스트 (프로덕션 릴리즈 항목)

### 서브태스크 4: 통합 검토 및 일관성 확인 (담당: 헤르메스 팀장)
- 3문서 간 용어/구조 일관성 확인
- 기존 RAG v2 스펙과의 정합성 검토
- 최종 품질 검수

---

## 실행 순서
1. 서브태스크 1, 2, 3 → 병렬 실행 (독립적)
2. 서브태스크 4 → 순차 실행 (1,2,3 완료 후)

## 예상 위험 및 대안

### 위험 1: 유튜브 콘텐츠의 비정형성
- 약관 PDF는 정형화된 구조(관/장/절)가 있으나, 유튜브 자막은 비정형적
- 대안: 유튜브용 섹션 감지 패턴을 별도 설계 (타임스탬프 기반 또는 Gemini 자동 분할)

### 위험 2: 기존 파이프라인과의 중복
- 현재 crawlYoutubeChannels.ts에서 이미 6섹션 요약을 생성하고 있음
- 대안: 기존 6섹션 요약을 Level 2로 매핑하거나, 별도의 3-Layer 생성 단계 추가

### 위험 3: 권위 계층 준수
- 유튜브는 4순위 참고자료로, 요약 품질이 아무리 좋아도 단독 인용 불가
- 대안: Level 1 요약에 반드시 "참고용" 경고 문구 포함 규칙 명시

---

## 실패 시나리오 체크리스트

### 1. 비정상 입력/상태
- 유튜브 자막이 없거나 자동생성 자막의 품질이 극히 낮은 경우: Level 3 원문 자체가 부실 → Level 2/1 품질 저하
- 대응: 자막 품질 점수 기반 필터링 기준 문서에 명시

### 2. 동시성/경쟁 조건
- 해당 없음: 문서 작성 작업이므로 동시성 이슈 없음
- 향후 구현 시 고려사항으로 계획서에 기록

### 3. 비정상 종료/타임아웃
- 해당 없음: 코딩 작업이 아닌 문서 작성 작업
- 문서 작성 중 컨텍스트 손실 방지를 위해 각 서브태스크를 독립 에이전트로 실행

### 4. 스테일 데이터
- 기존 RAG v2 스펙이 변경되었을 경우 문서 내용이 낙후될 수 있음
- 대응: 문서에 "기준 스펙 버전: v2.1" 명시, 스펙 변경 시 문서 갱신 필요

### 5. 통합 시 충돌
- 3문서 간 용어/개념 불일치 가능성
- 대응: 팀장이 최종 통합 검토 시 용어 통일 및 교차 참조 확인
