# InsuRo AI API 비용 분석 (1,000명 유저 목표)

## 분석일: 2026-03-10

---

## 1. 유저당 일일 토큰 사용량 추정

### Edge Function별 분석

**generate-content (콘텐츠 생성)**
- 입력 ~1,750 / 출력 ~1,150 토큰
- 일 5~15회 → 평균 10회

**generate-image (이미지 생성)**
- 입력 ~650 / 출력 ~300 토큰
- 일 10~30회 → 평균 20회

**suggest-topics (주제 추천)**
- 입력 ~500 / 출력 ~200 토큰
- 일 3~5회 → 평균 4회

**premium-chat (보험료 비교 채팅)**
- 입력 ~4,000 / 출력 ~1,250 토큰
- 일 20~50회 → 평균 35회 ★ 최대 소비

**newsletter-chat (뉴스레터 채팅)**
- 입력 ~2,750 / 출력 ~950 토큰
- 일 15~30회 → 평균 22회

**transcribe-call (통화 분석)**
- 입력 ~1,300 / 출력 ~450 토큰
- 일 2~5회 → 평균 3회

**analyze-customer (고객 분석)**
- 입력 ~1,650 / 출력 ~500 토큰
- 일 5~10회 → 평균 7회

**analyze-performance (성과 분석)**
- 입력 ~1,150 / 출력 ~1,000 토큰
- 일 1~3회 → 평균 2회

**evaluate-consultation (상담 평가)**
- 입력 ~2,100 / 출력 ~1,250 토큰
- 일 2~5회 → 평균 3회

**parse-premium-file (파일 파싱)**
- 입력 ~2,250 / 출력 ~1,000 토큰
- 일 5~20회 → 평균 10회

### 유저당 일일 합산

| 항목 | 입력 토큰 | 출력 토큰 |
|------|-----------|-----------|
| generate-content ×10 | 17,500 | 11,500 |
| generate-image ×20 | 13,000 | 6,000 |
| suggest-topics ×4 | 2,000 | 800 |
| premium-chat ×35 | 140,000 | 43,750 |
| newsletter-chat ×22 | 60,500 | 20,900 |
| transcribe-call ×3 | 3,900 | 1,350 |
| analyze-customer ×7 | 11,550 | 3,500 |
| analyze-performance ×2 | 2,300 | 2,000 |
| evaluate-consultation ×3 | 6,300 | 3,750 |
| parse-premium-file ×10 | 22,500 | 10,000 |
| **합계** | **279,550** | **103,550** |

**유저당 일일: 입력 ~280K + 출력 ~104K = 총 ~384K 토큰**

※ 활성 유저 비율 30% 가정 (1,000명 중 300명이 매일 사용)

### 월간 토큰 (1,000명, 활성 30%)

- 일일: 300명 × 384K = **115.2M 토큰/일**
- 월간: 115.2M × 30 = **3,456M (약 3.5B) 토큰/월**
  - 입력: ~2.5B / 출력: ~0.93B

---

## 2. Gemini API 비용 (아누 추천)

### Option A: Gemini 2.5 Flash (가성비 추천)
- 입력: $0.30 / 1M 토큰
- 출력: $2.50 / 1M 토큰

| 항목 | 토큰 | 단가 | 월 비용 |
|------|------|------|---------|
| 입력 | 2,517M | $0.30/1M | $755 |
| 출력 | 932M | $2.50/1M | $2,330 |
| **합계** | | | **$3,085/월 (~₩4,500,000)** |

### Option B: Gemini 2.5 Flash-Lite (초절약)
- 입력: $0.10 / 1M 토큰
- 출력: $0.40 / 1M 토큰

| 항목 | 토큰 | 단가 | 월 비용 |
|------|------|------|---------|
| 입력 | 2,517M | $0.10/1M | $252 |
| 출력 | 932M | $0.40/1M | $373 |
| **합계** | | | **$625/월 (~₩910,000)** |

### Option C: 하이브리드 (추천)
- 채팅/분석 (고품질 필요): Gemini 2.5 Flash
- 파싱/추천 등 (단순 작업): Flash-Lite

예상: **$1,500~2,000/월 (~₩2,200,000~2,900,000)**

---

## 3. Claude API 비용 (전담 인원 개념)

### Option D: Claude Haiku 4.5 (경량)
- 입력: $1.00 / 1M 토큰
- 출력: $5.00 / 1M 토큰

| 항목 | 토큰 | 단가 | 월 비용 |
|------|------|------|---------|
| 입력 | 2,517M | $1.00/1M | $2,517 |
| 출력 | 932M | $5.00/1M | $4,660 |
| **합계** | | | **$7,177/월 (~₩10,470,000)** |

### Option E: Claude Sonnet 4.6 (고품질)
- 입력: $3.00 / 1M 토큰
- 출력: $15.00 / 1M 토큰

| 항목 | 토큰 | 단가 | 월 비용 |
|------|------|------|---------|
| 입력 | 2,517M | $3.00/1M | $7,551 |
| 출력 | 932M | $15.00/1M | $13,980 |
| **합계** | | | **$21,531/월 (~₩31,400,000)** |

### Option F: Claude 하이브리드
- 채팅/분석: Sonnet 4.6
- 파싱/추천: Haiku 4.5

예상: **$12,000~15,000/월 (~₩17,500,000~21,900,000)**

---

## 4. 비교 요약

| 옵션 | 월 비용 | 연간 | 비고 |
|------|---------|------|------|
| Gemini Flash-Lite | ~₩91만 | ~₩1,090만 | 품질 타협, 초절약 |
| Gemini Flash | ~₩450만 | ~₩5,400만 | 가성비 추천 |
| Gemini 하이브리드 | ~₩220~290만 | ~₩2,640~3,480만 | ★ 아누 추천 |
| Claude Haiku | ~₩1,047만 | ~₩1.26억 | Gemini 대비 3.3배 |
| Claude Sonnet | ~₩3,140만 | ~₩3.77억 | 최고 품질, 최고가 |
| Claude 하이브리드 | ~₩1,750~2,190만 | ~₩2.1~2.6억 | 전담 인원 개념 |

## 5. 비용 절감 포인트
- **Prompt Caching**: 시스템 프롬프트 캐싱으로 입력 비용 최대 90% 절감 (Claude), 75% (Gemini)
- **Context 최적화**: premium-chat이 전체 비용의 48% 차지 → RAG 방식으로 전환하면 대폭 절감
- **활성 유저율**: 30%는 보수적. 초기엔 10~15%일 수 있어 비용 1/2~1/3
- **Batch API**: 비실시간 작업(파싱, 분석)은 Batch API 활용 시 50% 할인

## 6. 결론
- **비용 우선**: Gemini 하이브리드 (~₩250만/월)
- **품질 우선**: Claude 하이브리드 (~₩2,000만/월), 약 8배 비쌈
- **절충안**: 핵심 분석(고객/상담)만 Claude, 나머지 Gemini → ₩500~700만/월
