# 인슈위키 정제 UX 개선 Phase 1 — 월 필터링 버그 + progress 기준 변경

## 배경
인슈위키탭 카카오톡 정제 기능에 4가지 개선 필요. Phase 1은 기능 버그(필터링)와 핵심 UX(progress 기준) 수정.

## 이슈 1: 월 필터링 버그 (CRITICAL)
- **증상**: "3월 하반기(2026-03-H2)" 선택했는데 2947개 스레드 전체가 정밀 분리됨
- **기대**: 3월 하반기 메시지만 대상으로 필터링되어야 함
- **원인 추정**: knowledge_extractor_v2.py에서 selectedMonth 파라미터가 스레드 분리 단계에서 필터링에 사용 안 됨
- **수정**: 
  - 스레드 분리 시 selectedMonth 기준으로 해당 기간 메시지만 대상으로 필터링
  - H1 = 1~15일, H2 = 16~말일
  - 필터링 후 스레드 수가 맞는지 로그 출력

## 이슈 2: progress bar 기준 변경
- **현재**: 정제(LLM 호출) 시작부터 0~100%
- **요구**: 작업 전체(파일 읽기 → 파싱 → 스레드 분리 → 정제 → 저장) 기준
- **수정**:
  - 0~5%: 파일 읽기 + 메시지 파싱
  - 5~15%: 스레드 분리 (메시지 기반 + LLM 정밀 분리)
  - 15~95%: LLM 정제 (배치 처리)
  - 95~100%: 결과 저장 + 정리
  - `_write_progress()` 호출 시 전체 기준 퍼센트로 변환

## 수정 파일 (예상)
- `knowledge_extractor_v2.py` — 월 필터링 + progress 재설계
- 대시보드 프론트엔드 — progress bar가 새 기준에 맞게 표시
- `refine-status.json` — progress 구조 변경 있으면 반영

## 검증 시나리오 (이게 되면 성공)
1. "2026-03-H2" 선택 시 3월 16~31일 메시지만 스레드 분리 (2947개 → 대폭 감소)
2. progress bar가 파일 읽기 시작부터 0%로 시작
3. 스레드 분리 단계에서 5~15% 범위로 표시
4. LLM 정제 단계에서 15~95% 범위로 표시
5. 전체 완료 시 100%

## knowledge_extractor_v2.py 위치 확인 필요
- `/home/jay/projects/insuwiki/scripts/kakao_knowledge/knowledge_extractor_v2.py` 또는
- `/home/jay/workspace/` 하위 검색

## 주의사항
- insuwiki 프로젝트 코드 수정 시 해당 프로젝트 디렉토리에서 작업
- 수정 후 즉시 커밋
- 정제를 실제 실행하여 테스트 (소규모 데이터로)
