# Task: InfoKeyword Step 5/6/7 개선 설계 문서 준비

## Task ID: task-242.1

## ★ 문서 준비만 (구현 금지)
이 작업은 설계 문서만 작성한다. 실제 코드 수정은 하지 않는다.
1팀이 Step 2/3/4 수정을 마친 후, 두 팀 결론을 Merge해서 실제 구현에 들어갈 예정.

## 제이회장님 요구사항

### 5. 광고성 여부 (step5_promotional) 개선
- 블로그 탭 TOP10 중 **"광고" 표시가 있는 건 제외**하고 분석
- 나머지 블로그 중 몇 개가 **광고/홍보성**이고 몇 개가 **정보성**인지 숫자로 표시
- 위치 정보도 함께 표시:
  - "정보성: Top 1, 3, 5위"
  - "홍보성: Top 2, 4, 6, 7위"
  - 이런 식으로 각각 어떤 순위에 있는지 명시

### 6. 외부 블로그 (step6_external_blog) 개선
- 외부 블로그가 **몇 개**인지 숫자로 명확히 표기
- (예: "외부 블로그 2개 / TOP10 중")

### 7. 카페 뱃지 (step7_cafe_badge) 개선
- TOP10 중 **대표카페가 몇 개**인지 숫자로 표기
- (예: "대표카페 3개 / TOP10 중")

## 조사 및 문서 작성 범위

### 1. 현재 Worker 로직 분석
각 step의 현재 구현을 읽고 정리:
- `/home/jay/projects/InfoKeyword/worker/pipeline/analyzer.py` — 전체 파이프라인
- `/home/jay/projects/InfoKeyword/worker/crawler/blog_search.py` — 블로그 검색 (step5, step6 공통)
- `/home/jay/projects/InfoKeyword/worker/crawler/blog_content.py` — 블로그 내용 크롤링
- `/home/jay/projects/InfoKeyword/worker/crawler/cafe_search.py` — 카페 검색 (step7)
- `/home/jay/projects/InfoKeyword/worker/analyzer/` — 홍보성 분석 모듈들

### 2. 개선 설계서 작성
각 step별로:
- **현재 동작** (as-is): 어떤 데이터를 크롤링하고, 어떤 기준으로 판정하는지
- **문제점**: 제이회장님 요구사항 대비 부족한 점
- **개선안** (to-be): 어떻게 수정해야 하는지 구체적으로
  - Worker 측 수정 (크롤러, 분석기, 반환 데이터 구조)
  - Frontend 측 수정 (표시 방식, UI 컴포넌트)
- **데이터 스키마 변경**: step 결과 dict에 추가/변경할 필드 정의
- **영향 범위**: 수정 시 다른 step이나 기존 데이터에 미치는 영향

### 3. 네이버 블로그 탭 "광고" 표시 처리
- 네이버 블로그 검색 결과에서 "광고" 라벨이 붙은 항목 식별 방법 조사
- 크롤링 시 광고 항목 필터링하는 구체적 방법 (HTML 셀렉터, API 필드 등)

## 산출물
- `/home/jay/workspace/memory/specs/step567-improvement-spec.md`
  - 현재 동작, 문제점, 개선안, 스키마 변경, 영향 범위 포함
  - 1팀의 step 2/3/4 수정 결과와 Merge 가능하도록 구조화

## 주의사항
- **코드 수정 금지** — 설계 문서만 작성
- Worker 코드를 읽되 변경하지 말 것
- 실제 네이버 크롤링 테스트는 가능 (현재 동작 확인 목적)

## 완료 후
1. 설계 문서: `/home/jay/workspace/memory/specs/step567-improvement-spec.md`
2. 보고서: `/home/jay/workspace/memory/reports/task-242.1.md`
