# 이미지 생성 가이드 — 방법별 사용 기준 + 시스템 통합 방안

**작성일**: 2026-03-24
**근거**: task-849.1 ~ task-865.1 (7개 방법 테스트 결과 집대성)
**에이전트 미팅**: 2026-03-24 만장일치 합의

---

## 1. 확정된 이미지 생성 방법 (3+1)

### 1-1. Gemini Pro Image — 포토리얼리스틱 광고 (주력)
- **모델**: gemini-3-pro-image-preview
- **속도**: 25.4초/장
- **비용**: $0 (gcloud 토큰)
- **한글**: 90%+ 정확
- **품질**: 최상 (시네마틱, 프롬프트 준수도 최고)
- **용도**: 포토리얼리스틱 광고, SNS 메인 이미지, 캠페인 비주얼
- **테스트**: task-858.1
- **코드**: `/home/jay/workspace/tools/ai-image-gen/`

### 1-2. Satori HTML→PNG — 카드뉴스/배너 (템플릿)
- **방식**: Vercel Satori (HTML/CSS→SVG) + resvg-js (SVG→PNG)
- **속도**: 0.32초/장 (25~75배 빠름!)
- **비용**: $0
- **한글**: 100% 정확
- **품질**: 디자인 템플릿 의존 (데이터 시각화에 강함)
- **용도**: 카드뉴스, 배너, 인포그래픽, A/B 테스트 대량 생산
- **테스트**: task-865.1
- **코드**: `/home/jay/workspace/tools/ai-image-gen/satori-test/`

### 1-3. 하이브리드 (Gemini배경 + HTML오버레이) — 한글+포토리얼 동시
- **방식**: Gemini API 배경 생성 + HTML/CSS 텍스트 오버레이 + Playwright 캡처
- **속도**: ~25초/장
- **비용**: $0
- **한글**: 100% 정확 (HTML 렌더링이므로 오타 불가)
- **품질**: 높음 (AI 이미지 품질 + 완벽한 텍스트)
- **용도**: 한글 텍스트가 많은 포토리얼 광고, 보험상품 홍보
- **테스트**: task-859.1
- **코드**: `/home/jay/workspace/tools/ai-image-gen/`

### 1-4. GPT Image v2 (high) — 백업
- **모델**: gpt-image-1, quality=high
- **속도**: 38.3초/장
- **비용**: $0.167/장
- **한글**: high만 정확
- **용도**: Gemini 서비스 장애 시 대체
- **테스트**: task-855.1

---

## 2. 용도별 의사결정 트리

```
이미지 생성 필요
  ├─ 포토리얼리스틱 필요?
  │   ├─ YES: 한글 텍스트 많음?
  │   │   ├─ YES → 하이브리드 (hybrid-image)
  │   │   └─ NO → Gemini Pro (gemini-image)
  │   └─ NO: 카드뉴스/배너/인포그래픽?
  │       ├─ YES → Satori (satori-cardnews)
  │       └─ NO: HTML 캐러셀 (기존 carousel-gen)
  │
  └─ Gemini 장애 시
      └─ GPT Image v2 high (백업)
```

---

## 3. 제외된 방법과 사유

- **MeiGen MCP** (task-861.1): 한글 0% 실패, DALL-E 3 한계
- **Jaaz** (task-862.1): gpt-image-1 직접 호출과 동등, 부가가치 없음
- **GPT v1 medium** (task-853.1): 초보 수준 품질, 광고 불가

---

## 4. 비용/속도/품질 비교

### 비용 (장당)
- Gemini Pro: $0
- Satori: $0
- 하이브리드: $0
- GPT v2 high: $0.167

### 속도 (초/장)
- Satori: 0.32
- HTML 캐러셀: ~2
- Gemini Pro: 25.4
- 하이브리드: ~25
- GPT v2 high: 38.3

### 한글 정확도
- Satori: 100%
- 하이브리드: 100%
- HTML 캐러셀: 100%
- Gemini Pro: 90%+
- GPT v2 high: ~100%

---

## 5. 팀 구조 및 코드 오너십 (에이전트 미팅 합의)

### 결정: 전담 팀 신설 불필요, 스킬 호출 방식

- **비너스(Gemini센터)**: 디자인 시스템 관리자 + 프롬프트 라이브러리 큐레이터
  - design-tokens.json 관리
  - Gemini/GPT 프롬프트 템플릿 설계
  - 새 이미지 생성 방법 평가
  - 직접 실행은 하지 않음
- **불칸(dev1 백엔드)**: image_router.py + gcloud_auth.py 오너
- **이리스(dev1 프론트)**: carousel-gen/ + Satori 템플릿 오너
- **아르고스(dev1 QA)**: 테스트 스위트 오너

### 스킬 인식 범위

- image-gen-guide: 전체 (아누 포함)
- gemini-image: dev1, dev2, 마케팅팀
- satori-cardnews: dev1, dev2, 마케팅팀
- hybrid-image: dev1, dev2, 마케팅팀

---

## 6. 선결 과제

1. **gcloud 인증 영구화** — API Key 또는 서비스 계정 (자동화 전제조건)
2. **AI 생성 이미지 라벨링 정책** — Meta 광고 AI 라벨 이슈 확인
3. **design-tokens.json** — 멀티 브랜드 (ICA, InsuWiki, Pension)
4. **image_router.py** — 방법 자동 선택 + Gemini→GPT fallback

---

## 7. 품질 게이트 (모든 이미지 스킬 공통)

1. 해상도 >= 1080x1080
2. 파일 크기 > 100KB (빈 이미지 방지)
3. 한글 포함 시: OCR 대조 정확도 >= 95%
4. 브랜드 컬러 팔레트 준수
5. Meta 광고 기준 텍스트 비율 <= 20%

---

## 8. 산출물 보관 위치

```
/home/jay/workspace/tools/ai-image-gen/
├── output/v1-gpt-poc/          # task-853.1
├── output/v2-gpt-advanced/     # task-855.1
├── output/v2-gemini-nb2/       # task-857.1
├── output/v3-gemini-pro/       # task-858.1 ⭐
├── output/v4-hybrid/           # task-859.1
├── output/v5-meigen/           # task-861.1
├── output/v6-jaaz/             # task-862.1
├── output/v7-satori/           # task-865.1 🌟
├── carousel-gen/               # HTML 캐러셀
└── satori-test/                # Satori 엔진
```
