# task-1928: 카카오톡 정제 로직 고도화 — 5대 품질 이슈 수정

## 배경
인슈위키 카카오톡 정제 기능의 LLM 정제 품질에 5가지 이슈 발견. 제이회장님 직접 확인.

## 이슈 5건

### 이슈 1: 동일 주제 묶기 실패
- 현상: 하나의 주제로 내용이 길어질 때 동일 내용으로 제대로 묶어내지 못함
- 기대: 같은 주제의 긴 대화는 하나의 QA로 통합되어야 함
- 수정 방향: 정제 프롬프트에서 "같은 주제의 연속 대화는 하나의 QA로 통합" 강화. 주제 유사도 기반 클러스터링 로직 보강.

### 이슈 2: 답변 없는 질문 제외
- 현상: 질문만 있고 답변이 없는 건이 결과에 포함됨
- 기대: 답변이 없는 질문은 처음부터 제외
- 수정 방향: 정제 결과에서 answer가 비어있거나 null인 항목 필터링. 프롬프트에 "답변이 달리지 않은 질문은 반드시 제외" 명시.

### 이슈 3: 비질문을 질문으로 잡는 경우 — 인사/안부형
- 현상: "안녕하세요 궁금한 것이 있어서요~" 같은 인사/안부 문구를 질문으로 채택
- 기대: 구체적 보험 관련 질문만 채택. 인사/안부/서두는 질문이 아님
- 수정 방향: 프롬프트에 "인사, 안부, 서두, 감사 표현은 질문이 아님" 명시. 질문 판별 기준 강화.

### 이슈 4: 비질문을 질문으로 잡는 경우 — 일지/일기형
- 현상: "2026.03.24.(화) 1일1보 : 췌장암 케모포트 삽입수술, 폴피리녹스라는 치료,감사드립니다." 같은 개인 일지를 질문으로 잡음
- 기대: 개인 일지, 경험 공유, 감사 인사 등은 질문이 아님. 보험/금융에 대한 구체적 질문만 채택
- 수정 방향: 질문 판별 프롬프트에 "개인 일지, 치료 기록, 경험 공유, 감사/응원 메시지는 질문이 아님" 추가. 질문의 핵심 기준: "답변을 기대하는 보험/금융 관련 의문문"

### 이슈 5: 제목-질문-답변 매칭 불일치
- 현상: 질문-답변은 잘 맞지만, 제목이 질문/답변 내용과 맞지 않는 경우
- 기대: 제목은 질문의 핵심을 한 줄로 요약한 것이어야 함
- 수정 방향: 제목 생성 프롬프트에서 "반드시 질문 내용 기반으로 제목 생성" 강화. 답변 내용이 아닌 **질문 내용**에서 제목 추출.

## 수정 대상 파일
- 카카오톡 정제 관련 프롬프트/로직 파일 (코드 확인 후 특정)
- 프로젝트: insuwiki

## 검증 시나리오
1. 긴 대화 주제 → 하나의 QA로 통합 확인
2. 답변 없는 질문 → 결과에서 제외 확인
3. "안녕하세요~" 류 인사 → 질문으로 채택 안 됨 확인
4. 개인 일지/치료 기록 → 질문으로 채택 안 됨 확인
5. 제목이 질문 내용과 일치하는지 확인
6. 기존 정상 동작하는 정제는 회귀 없음

## 레벨
- normal

## 프로젝트
- insuwiki
