# Step 5 홍보성 판단 진단 리포트: "가공육 암"

**분석일**: 2026-03-04
**분석 대상 키워드**: 가공육 암
**문제**: Step 5 홍보성 분석에서 "홍보성 0/0개" — 분석 대상 블로그 자체가 0건

---

## 1. 진단 결과: 네이버 HTML 구조 변경 (크롤러 버그)

### 원인
네이버가 블로그 검색 결과 페이지의 HTML 구조를 변경함.
`blog_search.py`의 `_parse_blog_item()` 함수가 사용하는 **앵커 셀렉터 3개 모두 실패**:

| 기존 셀렉터 | 현재 상태 |
|---|---|
| `a[data-heatmap-target=".imgtitlelink"]` | ❌ 없음 |
| `a.title_link` | ❌ 없음 |
| `a.api_txt_lines` | ❌ 없음 |

### 현재 네이버가 사용하는 구조
- **블로그 항목 컨테이너**: `[data-template-id="ugcItem"]` → ✅ 정상 감지 (7건)
- **제목+URL 링크**: `a[data-heatmap-target=".link"]` → 기존 셀렉터에 없음
- **블로그명**: `a[data-heatmap-target="articleSourceJSX_title"]` → ✅ 기존 코드 정상 작동

### 흐름
```
네이버 검색 → HTML 파싱 → ugcItem 7건 감지 → _parse_blog_item() 호출
→ 앵커(a 태그) 찾기 실패 → return None → 유효 결과 0건
→ _step5_promotional(blogs=[]) → total_analyzed=0 → "0/0개"
```

---

## 2. 실제 검색 결과 (크롤러가 못 읽은 블로그 7건)

수동 파싱으로 확인한 실제 블로그 목록:

1. **행복바이러스** (blog.naver.com/hyo761)
   - "가공육섭취가 유방암 위험 높인다... 50세 미만 여성 더 위험해"
   - 네이버 블로그, 2025.10.01

2. **★유갑 카페** (cafe.naver.com/oooolle)
   - "젊은 유방암 가공육과 식습관이 만든 위험 신호"
   - 네이버 카페, 2025.09.30

3. **The News Medical_더뉴스메디칼** (blog.naver.com/thenewsmedical)
   - "암을 부르는 당신의 식탁, 붉은 고기와 가공육의 '침묵의 경고'"
   - 네이버 블로그 (공식), 1주 전

4~7. (추가 4건 존재, 동일 구조)

---

## 3. 제이회장님 판단 vs 시스템 판단

- **제이회장님 판단**: "가공육 암"에 홍보성 블로그가 없다는 건 맞지 않음 (피드백 요청)
- **시스템 판단**: 홍보성 0/0 (블로그를 아예 읽지 못함)
- **실제 상황**: 블로그 7건이 존재하지만, **크롤러 셀렉터 버그**로 하나도 파싱되지 않음

→ 홍보성/정보성 판단 자체가 실행되지 않았으므로, 이 결과는 **무효**.
셀렉터 수정 후 재분석해야 정확한 판단 가능.

---

## 4. 필요 조치

### 긴급 (Step 5 기능 복구)
`worker/crawler/blog_search.py` → `_parse_blog_item()` 앵커 셀렉터 업데이트:
```python
# 기존 (3개 모두 실패)
anchor = (
    item.find("a", attrs={"data-heatmap-target": ".imgtitlelink"})
    or item.find("a", class_="title_link")
    or item.select_one("a.api_txt_lines")
)

# 수정안 (네이버 현재 구조 대응)
anchor = (
    item.find("a", attrs={"data-heatmap-target": ".link"})
    or item.find("a", attrs={"data-heatmap-target": ".imgtitlelink"})
    or item.find("a", class_="title_link")
    or item.select_one("a.api_txt_lines")
)
```

### 함께 처리
- `config.py`: `SEARCH_VOLUME_THRESHOLD` 20 → 30
- Worker 재시작 후 "가공육 암" 재분석으로 검증

---

## 5. 결론

**"가공육 암" Step 5가 0/0을 보여준 것은 홍보성 판단 오류가 아니라, 블로그 크롤링 실패(네이버 HTML 변경).**
셀렉터 수정 후 재분석하면 7건의 블로그에 대해 정상적인 홍보성/정보성 판단이 수행됩니다.
