**task-1573.1 완료 보고** (dev1-team) **완료 보고서: 인슈위키 위키 항목 v2 파이프라인 재구축** (14분 35초) **핵심 결과** 원본 32,946줄을 v2 파이프라인으로 재분석하여 645건의 인사이트를 추출했다(v1 대비 63% 증가). 17개 카테고리로 분류되고, 지식 그래프(645노드/134,519엣지)와 벡터DB가 구축되었다. pytest 261건 전체 통과. ## 작업 내용 ### Step 0: task-1557 브랜치 merge - `task/task-1557.1-dev3` 브랜치를 master에 merge 완료 - v2 파이프라인 코드 4,117줄 추가 (knowledge_extractor_v2.py, knowledge_graph.py, vector_store.py 등) ### Step 1: 기존 데이터 백업 및 삭제 - `wiki_entries.json.bak.v1-final` 백업 생성 (446,135 bytes) - wiki.db는 워크트리에 미존재 (백업 불필요) - wiki_entries.json을 빈 배열 `[]`로 초기화 ### Step 2: v2 파이프라인 실행 - 규칙 기반 추출 (ANTHROPIC_API_KEY 미설정으로 LLM 폴백) - 입력: 7,328 메시지 / 385명 사용자 - 출력: 645건 인사이트 (wiki_entries_v2.json, 2.2MB) - 소요 시간: 1초 미만 ### Step 3: 결과 검증 및 저장 - wiki_entries_v2.json → wiki_entries.json 복사 - wiki.db import 완료 (645/645건) - 기존 v1 잔류 데이터 145건 발견 → DELETE 처리 완료 ### Step 4: 지식 그래프 + 벡터DB 구축 - 지식 그래 **발견/해결 이슈 5건** 1. **__pycache__ 파일로 merge 실패** — git stash + checkout으로 정리 후 merge 성공 2. **wiki.db에 v1 데이터 145건 잔류** — wiki_store.py의 _DEFAULT_DB_PATH가 메인 프로젝트 절대경로로 하드코딩되어 워크트리가 아닌 메인 DB에 import됨. DELETE FROM wiki_entries WHERE id LIKE 'kakao-%' + FTS rebuild로 해결 3. **중복 title 24건 (7종)** — 공지/템플릿 메시지 반복 등장. 내용(answer)은 서로 달라 실제 별개 항목. 현재 영향 없으므로 후속 정제 시 필터링 권장 4. **confidence 값 전체 "medium" 고정** — 미해결: LLM 미사용(ANTHROPIC_API_KEY 미설정)으로 규칙 기반 폴백 시 수치화 미적용. API 키 설정 후 --use-llm으로 재실행 시 해결 5. **wiki_store.py 하드코딩 경로** — 미해결: `_DEFAULT_DB_PATH`가 `/home/jay/projects/insuwiki/data/wiki.db`로 절대경로 하드코딩. 워크트리 환경에서 의도와 다른 DB에 접근. 별도 리팩토링 태스크 필요