# task: ThreadAuto 뉴스 크롤링 → 인사이트 컨텐츠 파이프라인 설계 (Lv.3)

## 레벨: Lv.3 (리서치 + 에이전트 미팅 3사이클 필수)

## 배경
현재 ThreadAuto는 evergreen_topics.json의 상시 토픽만 사용하여 콘텐츠를 생성한다.
제이회장님이 **실시간 보험 뉴스 기반 콘텐츠** 소스를 추가하길 원한다.

## 요구사항

### 뉴스 소스 2곳
1. **매일경제 보험 섹션**: https://www.mk.co.kr/news/financial/insurance
2. **보험저널 보험산업 섹션**: https://www.insjournal.co.kr/news/articleList.html?sc_multi_code=S2&view_type=sm

### 필터링 규칙
- **사용 가능**: 보험 업계 전반에 대한 내용 (트렌드, 정책, 제도 변경 등)
- **사용 불가**: 특정 회사에 대한 내용 (예: "삼성생명 실적 발표", "한화손해 인사" 등)
- 특정 회사명이 본문에 등장하더라도, 핵심 메시지가 업계 전반이면 사용 가능

### 인사이트 추가 (핵심)
- 뉴스에서 얻은 fact를 그대로 전달하는 것이 아님
- fact를 기반으로 **"서울대보험쌤"의 관점에서 인사이트**를 추가하여 최종 콘텐츠화
- 예: "보험업계 디지털 전환 가속" 뉴스 → "이런 변화가 설계사에게 의미하는 것은..."

### ThreadAuto 통합
- run_text_post.py 또는 run_card_post.py 실행 시 뉴스 기반 콘텐츠도 선택지에 포함되어야 함
- 기존 evergreen_topics.json 기반 토픽과 자연스럽게 공존
- fact_guard 검증 적용 필수 (뉴스 기사의 수치는 출처 URL과 함께 fact_db에 등록 또는 별도 처리)

## 에이전트 미팅 규칙 (3사이클 필수)
- **레드팀(로키) 무조건 참석** (제이회장님 지시)
- 미팅에서 다룰 핵심 질문:
  1. 크롤링 방식: 어떤 기술로? (requests+BS4? Scrapling? Lightpanda?) 주기는? 저장 형식은?
  2. 필터링 방식: "특정 회사" vs "업계 전반" 판별을 어떻게? (키워드? AI 분류?)
  3. 인사이트 생성: 어떤 프롬프트/파이프라인으로? fact_guard와의 연계는?
  4. ThreadAuto 통합: 기존 파이프라인에 어떻게 끼워넣을지? (새 토픽 타입? 별도 스크립트?)
  5. 법적/저작권 리스크: 뉴스 기사 내용을 SNS에 활용할 때의 저작권 이슈
- "3 Whys" 품질 검증 적용: 모든 결정에 "왜?"를 3번 던져서 답할 수 있어야 함

## 산출물
1. 에이전트 미팅 3사이클 기록 (memory/meetings/ 하위)
2. 최종 설계 문서: 크롤링 → 필터링 → 인사이트 생성 → ThreadAuto 통합 전체 파이프라인 설계
3. 구현 계획서: Phase별 작업 분할, 예상 수정 파일 목록
4. ⚠️ 코딩은 하지 말 것 — 설계와 계획까지만. 구현은 별도 위임.

## 프로젝트 경로
- ThreadAuto: /home/jay/projects/ThreadAuto/
- 프로젝트 맵: /home/jay/workspace/memory/project-maps/threadauto.md
