# task-1937: 네이버 블로그 모델별 실제 글 생성 E2E 테스트

## 목적
task-1936+1에서 추가한 모델 선택 기능이 실제로 각 모델에서 글 생성 완료까지 동작하는지 E2E 테스트.
task-1936+1에서 "생성 시작" 200 OK만 확인하고 완료까지 대기하지 않았으므로 보완.

## ★★★ 이 작업은 테스트만. 코드 수정 없음. ★★★
## ★★★ API 호출 금지. 모든 LLM은 CLI로만 호출. ★★★

## 테스트 절차

각 모델별로 동일한 키워드("실손보험 청구 방법")로 글 생성을 실행하고 **완료까지 대기**.

### 테스트 대상 모델 (task-1936+1에서 추가된 목록)
1. `claude-sonnet-4-6` (Claude Sonnet)
2. `claude-haiku-4-5-20251001` (Claude Haiku)
3. `gemini-2.5-flash` (Gemini Flash)
4. `gemini-2.5-pro` (Gemini Pro)
5. `codex` (Codex)
6. `glm-5` (GLM)

### 각 모델별 테스트 항목
1. `POST /api/naver-blog/write/start` → 200 OK (생성 시작)
2. `GET /api/naver-blog/write/status` 폴링 → progress 100% 도달 대기 (timeout 180초)
3. 생성 완료 시:
   - status = "completed" 또는 "success"
   - 생성된 글 내용 확인 (비어있지 않은지, 최소 1000자 이상)
   - 한글 정상 출력
   - 제목/본문 구조 정상
4. 생성 실패 시:
   - 에러 메시지 기록
   - CLI 미설치/권한 문제인지, 모델 응답 문제인지 구분
5. 히스토리에 결과 기록 확인

### 결과 비교표 (보고서에 포함)
```
| 모델 | 생성 성공 | 소요 시간 | 글 길이(자) | 품질 메모 | 에러 내용 |
```

## 주의사항
- 각 모델 테스트 사이에 이전 생성 완료/clear 확인 (동시 생성 방지)
- Codex, GLM CLI가 설치되어 있는지 먼저 확인 (`which codex`, `which glm` 등)
- CLI 미설치 모델은 "CLI 미설치"로 기록 (에러가 아닌 환경 문제)
- 테스트 중 생성된 글은 네이버에 발행하지 말 것

## 프로젝트
- insuwiki

## 레벨
- normal