# task-2064: 카카오톡 정제 24% crash 분석 + 수정

## 문제
카카오톡 정제가 24% (20/125 스레드 처리, 12건 추출) 시점에서 프로세스 비정상 종료.
PID: 2083447 (dead). task-2057에서 체크포인트 mkdir 수정했지만 다른 원인으로 다시 crash.

## ★ 프로젝트: `/home/jay/projects/insuwiki/`

## ★ 먼저 확인할 것
1. 프로세스 죽은 원인 — OOM(메모리 초과)? LLM API 에러? 파일 파싱 에러?
2. 로그 확인:
   ```bash
   ls -la /home/jay/projects/insuwiki/scripts/kakao_knowledge/output_*/logs/ 2>/dev/null
   cat /home/jay/projects/insuwiki/scripts/kakao_knowledge/output_*/logs/*.log 2>/dev/null | tail -50
   ```
3. dmesg에 OOM killer 흔적:
   ```bash
   dmesg | grep -i "oom\|killed\|out of memory" | tail -10
   ```
4. progress 파일에서 마지막 상태:
   ```bash
   find /home/jay/projects/insuwiki -name "*progress*" -newer /home/jay/projects/insuwiki/scripts/kakao_knowledge/knowledge_extractor_v2.py | head -5
   cat 해당_파일 | python3 -m json.tool | tail -20
   ```

## 분석 후 수정
- OOM이면: 배치 크기 축소 또는 메모리 제한 추가
- LLM API 에러이면: 재시도 로직 강화 (현재 몇 회 재시도?)
- 파일 파싱 에러이면: 해당 스레드 skip 로직 추가
- 원인 불명이면: 전체 try/except + 에러 로그 강화

## 완료 시그니처
- crash 원인 특정 + 수정
- 동일 파일로 정제 재실행 시 24% 이후 정상 진행

## 검증 시나리오
1. 원인 분석 보고서에 crash 원인 명시
2. 수정 코드 적용 후 정제 재실행 → 24% 이후 진행
3. 기존 pytest PASS

## 레벨
- critical

## 프로젝트
- dev-system