# 인슈위키 위키 v2 파이프라인 — 2026년 3월 데이터 실행

## 배경
- task-1575.1에서 LLM 호출을 Claude CLI로 전환 완료
- 전체 32,946줄 실행은 수 시간 소요 → 먼저 3월 한달치(9,913줄)로 품질 확인
- 3월 데이터 추출 파일: `/tmp/kakao-march-2026.txt` (9,913줄)

## 작업 내용

### 1. v2 파이프라인 실행 (LLM 모드)
```bash
cd /home/jay/projects/insuwiki/.worktrees/task-1575.1-dev1
PYTHONPATH=scripts python3 -m scripts.kakao_knowledge pipeline-v2 \
  /tmp/kakao-march-2026.txt \
  --output scripts/kakao_knowledge/wiki_entries_march.json \
  --use-llm \
  --batch-size 20
```
- `--use-llm` 필수 — LLM 정밀 분석 활성화
- batch_size=20으로 축소 (안정성)

### 2. 결과 검증
1. 추출 건수 확인
2. 품질 확인 — 샘플 5건:
   - 질문과 답변이 주제적으로 일치하는지
   - 공지사항/인사말이 질문으로 분류되지 않는지
   - 스레드 경계가 정확한지 (다음 질문 미포함)
   - 카테고리 분류가 적절한지
3. 카테고리 분포 출력

### 3. 대시보드 반영
검증 통과 시:
1. `wiki_entries_march.json` → main 브랜치의 `scripts/kakao_knowledge/wiki_entries.json`에 복사
2. wiki.db import
3. 대시보드 서버 재시작: `systemctl --user restart dashboard.service`
4. API 검증: `curl -s http://localhost:8000/api/wiki/entries | python3 -c "..."`

## 보고서
`/home/jay/workspace/memory/reports/task-1576.md`에 작성
- 추출 건수, 카테고리 분포, 샘플 5건 Q/A 내용 포함
