**task-1928 완료 보고** **task-1928 완료 보고서: 카카오톡 정제 로직 고도화 — 5대 품질 이슈 수정** **핵심 결과** LLM 프롬프트 고도화(Stage 1/Stage 2) + 규칙 기반 비질문 필터링 로직 + QA 답변 없음 필터링을 통합 적용하여 5대 이슈 모두 해결. pytest 57건 전체 통과(기존 52건 + 신규 5건), 기존 테스트 회귀 0건. ## 수정 파일 | 파일 | 변경 내용 | grep 검증 | 상태 | |------|-----------|-----------|------| | scripts/kakao_knowledge/knowledge_extractor_v2.py:89 | Stage 1 프롬프트에 비질문 판별 기준 추가 | grep "비질문 판별 기준" OK | verified | | scripts/kakao_knowledge/knowledge_extractor_v2.py:119 | Stage 2 프롬프트에 주제 통합/질문 판별/제목 생성 규칙 추가 | grep "주제 통합 규칙" OK | verified | | scripts/kakao_knowledge/knowledge_extractor_v2.py:65 | _NON_QUESTION_PHRASES + _is_non_question_message + _is_non_question_thread 함수 추가 | grep "_is_non_question_thread" OK | verified | | scripts/kakao_knowledge/knowledge_extractor_v2.py:898 | _rule_based_filter_single에 비질문 스레드 제외 로직 추가 | grep "비질문 스레드" OK | verified | | scripts/kaka **발견/해결 이슈 3건** 1. **규칙 기반 경로에서 비질문 필터링 누락** — LLM 프롬프트만 수정하면 use_llm=False 경로에서 효과 없음. `_is_non_question_thread` 함수 + `_rule_based_filter_single` 연동으로 해결 2. **인사 정규식 매칭 실패** — 한국어 인사의 다양한 구두점/특수문자 조합(~, !, ?)을 처리하기 위해 구두점 제거 후 구문 매칭 방식으로 전환 3. **Pyright 타입 에러** — `_build_insight_from_llm`의 반환 타입이 None을 포함하지 않아 타입 에러 발생. `Optional[dict]`로 수정