# 약관AI 심층 검증 -- 라운드 5: 최종 합의 + 실행 계획

**날짜**: 2026-03-03
**진행**: 아누 (개발실장)
**참석자**: 헤르메스, 오딘, 아르고스, 비너스, 로키, 김현장, 박신입, 강베테, 이심사, 정검사, 최변호
**상위 문서**: `memory/meetings/2026-03-03-round4-response-plans.md`
**성격**: 최종 라운드 -- Go/No-Go 판정, 의사결정 투표, 실행 계획 확정

---

## Part 1. Go/No-Go 판정

### 1.1 판정: **조건부 Go (Conditional Go)**

**현 상태 즉시 출시: No-Go.**
**8주 로드맵 Phase 0~1 완료 후: Go.**

#### 근거

**즉시 출시가 불가능한 이유 (출시 차단 사유)**:

| # | 차단 사유 | 관련 클러스터 | 위험 수준 |
|---|-----------|---------------|-----------|
| 1 | 이용약관/개인정보처리방침 미비 | CL-4 | 과태료 3,000만원 + 환불 분쟁 시 100% 패소 |
| 2 | 면책조항 절단(청킹 결함) | CL-1 | 면책기간/감액기간 오답 → 설계사 피해 → 손해배상 |
| 3 | FLAT 인덱스 + 캐싱 없음 | CL-3 | 100명만 사용해도 적자, DoW 공격 시 무한 과금 |
| 4 | 상품 세대 혼합 | CL-2 | 실손 4세대 오답 → 자기부담금 수천만원 차이 |
| 5 | Rate Limit/보안 부재 | CL-6 | 오픈 첫 주 시스템 프롬프트 탈취 + 비용 공격 |

**조건부 Go의 조건**:

Phase 0(법적 인프라) + Phase 1(기술 핵심) 완료 = **최소 4주 후 출시 가능**.
이 시점에서 다음 14개 항목이 완료되어야 합니다:

| # | 항목 | Phase | 완료 기준 |
|---|------|-------|-----------|
| 1 | 이용약관 작성 + 변호사 검토 완료 | 0 | 법률 검토 서명 |
| 2 | 개인정보처리방침 게시 | 0 | 서비스 페이지에 링크 |
| 3 | 쿼리 로그 개인정보 마스킹 | 0 | 실명 패턴 자동 필터링 작동 확인 |
| 4 | 답변 출력 필터 (단정 표현 자동 치환) | 0 | "보장됩니다" → "~로 보입니다" 자동 변환 100% |
| 5 | 구조 인식 청킹 + 단서조항 보존 | 1 | "다만" 키워드 100건 샘플 중 100% 동일 청크 |
| 6 | 전체 재인덱싱 완료 | 1 | 45만 청크 재처리 + 검증 |
| 7 | effectiveDate.end 자동 설정 | 1 | 신규 업로드 시 구버전 비활성화 자동 |
| 8 | 실손 세대 메타데이터 적용 | 1 | 실손 검색 시 세대 혼합 0건 |
| 9 | ANN 인덱스 전환 (TREE_AH) | 1 | 쿼리당 읽기 비용 90% 이상 절감 |
| 10 | 정확 일치 캐싱 레이어 | 1 | 동일 쿼리 2번째부터 캐시 히트 |
| 11 | Rate Limiting 적용 | 1 | 분/시/일 제한 작동 + 429 반환 |
| 12 | 프롬프트 인젝션 필터 | 1 | 인젝션 패턴 15건 테스트 전건 차단 |
| 13 | Firestore 보안규칙 재설정 | 1 | insurance_metadata 공개 읽기 차단 |
| 14 | 특약 가입 확인 경고 삽입 | 1 | 특약 관련 모든 답변에 경고 포함 |

### 1.2 출시 후 허용 가능한 잔여 리스크

다음은 출시 시점에 **완전 해결되지 않아도 허용**되는 리스크입니다:

| # | 잔여 리스크 | 허용 근거 | 완화 조치 |
|---|------------|-----------|-----------|
| 1 | 별표(수술/장해분류표) 검색 불가 (CL-9) | 주력 기능이 아닌 부가 기능. 안내 문구로 대체 | "수술분류표는 약관 원본을 참조하세요" 안내 |
| 2 | 다상품 비교 미구현 (CL-8/E-6) | 킬러 피처이지만 단일 상품 검색만으로 MVP 가치 존재 | "비교 기능 준비 중" 로드맵 공유 |
| 3 | 보험료 조회 불가 (E-11) | 약관AI의 핵심은 보장 내용 검색, 보험료는 별도 서비스 | "보험료는 보험다모아 참조" 안내 |
| 4 | AMBIGUOUS 구간 일부 잔존 (CL-5) | 임계값 조정으로 50% 감소 목표, 0%는 불가 | 모호한 결과에 "정확한 상품명을 입력하세요" 유도 |
| 5 | 비정형 구조 약관(~5%) 청킹 불완전 | 구조 인식 패턴 5종 커버, 나머지는 폴백 | 폴백 적용 약관 목록 관리 + 점진 개선 |
| 6 | text-embedding-004 단종 리스크 (G-10) | deprecated이지 서비스 종료 아님. 마이그레이션 계획 수립 완료 | 대안 모델 벤치마크 사전 수행 |
| 7 | 약관 업데이트 수동 운영 (CL-7 일부) | 출시 초기 상품 수 제한적(50개사 주요 상품). 수동 가능 | 주 1회 수동 체크 + 점진 자동화 |
| 8 | JWT 미전환 (H-3) | Firebase Auth 기본 인증으로 우선 대체 | Phase 2에서 전환 |

---

## Part 2. 핵심 의사결정 3가지 -- 전원 투표

### 의사결정 1: AI 답변 방식

**안건**: "구조화된 원문 제시"로 갈 것인가, "판단형 답변"도 포함할 것인가?

- **A안 (구조화된 원문 제시만)**: 답변 형식을 "관련 조항 + 원문 인용 + 참고 안내"로 고정. AI가 결론을 내리지 않음.
- **B안 (판단형 답변 포함)**: A안 + "이 조항에 따르면 ~할 가능성이 높습니다" 수준의 해석 허용.

#### 투표 결과

| 페르소나 | 투표 | 의견 |
|----------|------|------|
| 헤르메스 | **A안** | 기술적으로 판단형 답변의 정확도를 보장할 수 없습니다. 구조화된 원문 제시가 안전합니다 |
| 오딘 | **A안** | 판단형 답변은 검증 비용이 기하급수적으로 증가합니다. MVP는 A안이 맞습니다 |
| 아르고스 | **A안** | 테스트 관점에서, 원문 제시의 정확도는 측정 가능하지만 판단형 답변의 정확도 기준을 정의하기 어렵습니다 |
| 비너스 | **조건부 B안** | UX 관점에서 원문만 보여주면 설계사가 해석해야 합니다. 최소한 "요약"은 필요합니다. 단, "보장됩니다"가 아닌 "~에 해당할 수 있습니다" 수준 |
| 로키 | **A안** | 판단형 답변은 법적 리스크의 문을 여는 것입니다. 한번 열면 닫을 수 없습니다 |
| 김현장 | **조건부 B안** | 원문만 보여주면 현장에서 속도가 느려집니다. 1줄 요약은 있어야 합니다 |
| 박신입 | **B안** | 저는 약관 원문을 보고 해석하기 어렵습니다. 요약이 없으면 사용이 힘듭니다 |
| 강베테 | **A안** | 경력자는 원문만 봐도 됩니다. 오답보다 원문이 낫습니다. 다만 원문 하이라이팅은 필수 |
| 이심사 | **A안** | 보험협회 관점에서, "검색 도구"로 남아야 규제를 피합니다 |
| 정검사 | **A안** | 금감원은 "해석"을 하는 순간 주목합니다. A안이 규제 안전지대입니다 |
| 최변호 | **A안 + 요약 타협** | A안이 법적으로 안전하지만, "원문 기반 1줄 요약"은 검색 결과 정리에 해당하므로 허용 범위입니다 |

#### 최종 결정: **A안 + 원문 기반 요약 (타협안)**

**확정 답변 형식**:
```
[관련 조항]: 제15조 (보험금 지급사유)
[원문 인용]: "피보험자가 보험기간 중에 암으로 진단확정 되었을 때
            암진단보험금을 지급합니다. 다만, 계약일로부터 90일 이내에
            진단확정된 경우에는 면책으로 합니다."
[요약]: 암 진단 시 보험금 지급 대상이나, 계약 후 90일 면책기간 적용
[안내]: 정확한 보장 여부는 보험증권 및 보험사에 확인하세요.
```

**기술적 구현 규칙**:
1. "요약"은 원문에 명시된 내용만 압축. 원문에 없는 판단 금지
2. 후처리 필터로 "보장됩니다", "지급합니다" 등 단정 표현 자동 치환
3. 원문 인용은 조문 번호를 필수 포함하여 검증 가능하게

**찬성 8 / 조건부 찬성 3 / 반대 0** -- 전원 합의

---

### 의사결정 2: 베타 전략

**안건**: 무료 베타 먼저 vs 유료 소규모 런칭?

- **A안 (무료 베타 선행)**: 4주간 무료 베타(1차 지점 10명 + 2차 확대 50명) -> 피드백 반영 -> 유료 전환
- **B안 (유료 소규모 런칭)**: 처음부터 유료(월 9,900원) 소규모 런칭(초대 코드 방식, 100명 한정)

#### 투표 결과

| 페르소나 | 투표 | 의견 |
|----------|------|------|
| 헤르메스 | **A안** | 무료 베타에서 버그를 잡고 가야 합니다. 유료 출시 첫 주에 오답이 터지면 치명적입니다 |
| 오딘 | **A안** | 피드백 루프(CL-7)를 베타에서 검증해야 합니다. 유료에서 "틀렸어요" 비율이 높으면 즉시 해지입니다 |
| 아르고스 | **A안** | 골든 테스트셋 300건을 베타 피드백에서 수집하는 것이 계획입니다. 무료 베타가 필수입니다 |
| 비너스 | **A안** | 무료 베타는 앰배서더 양성의 기회입니다. 이 사람들이 유료 전환 후 첫 고객이자 홍보대사가 됩니다 |
| 로키 | **A안** | 유료 서비스에서 보안 사고가 나면 법적 책임이 더 큽니다. 무료 단계에서 보안 테스트를 마쳐야 합니다 |
| 김현장 | **A안** | 무료라도 좋으니 빨리 써보고 싶습니다. 다만 베타가 3개월 넘어가면 흥미를 잃습니다. 4주가 적절합니다 |
| 박신입 | **A안** | 무료로 먼저 써보고 가치를 느끼면 돈 내겠습니다 |
| 강베테 | **조건부 A안** | 무료 베타는 좋은데, 베타 끝나고 유료 전환 시 "무료 때는 됐는데 왜 이제 돈 받아?"라는 반발이 있을 수 있습니다. 베타 참여자에게 할인 혜택을 주세요 |
| 이심사 | **A안** | 무료 베타 단계에서 보험협회와의 소통도 가능합니다. "테스트 중"이라는 포지셔닝이 규제 여지를 줍니다 |
| 정검사 | **A안** | 무료라면 규제 관점에서 훨씬 여유롭습니다. 유료 서비스는 소비자 보호법이 더 강하게 적용됩니다 |
| 최변호 | **A안** | 무료 베타라도 이용약관은 필요합니다. "베타 서비스로 오류가 있을 수 있습니다" 고지 필수 |

#### 최종 결정: **A안 -- 무료 베타 선행 (4주)**

**확정 베타 계획**:

```
1차 베타 (Week 5-6): 지점 내부 테스트
  - 대상: 제이회장님 지점 설계사 5-10명 (GA + 전속 혼합)
  - 목표: 치명적 버그 발견, UX 피드백, 핵심 시나리오 검증
  - 필수 포함: GA 경력자 2명 이상 (김현장 수준), 신입 2명 이상
  - 조건: Phase 0 + Phase 1 완료 후 시작

2차 베타 (Week 7-8): 확대 테스트
  - 대상: 외부 설계사 30-50명 (GA/전속/손보/생보 다양하게)
  - 목표: 검색 품질 최종 검증, 피드백 300건 수집, 서비스 안정성
  - 조건: 1차 베타 치명적 이슈 해결 후

베타 -> 정식 전환:
  - 베타 참여자 전원에게 정식 출시 후 1개월 무료 + 이후 20% 할인 (3개월)
  - "앰배서더" 타이틀 + 피드백 기여자 크레딧 표시
```

**찬성 10 / 조건부 찬성 1 / 반대 0** -- 전원 합의

---

### 의사결정 3: 모델 선택

**안건**: Gemini Flash 유지 vs Pro 전환 vs 하이브리드?

- **A안 (Flash 유지)**: 현행 Gemini 2.0 Flash 유지. 비용 효율 우선.
- **B안 (Pro 전환)**: Gemini 2.0 Pro로 전환. 품질 우선.
- **C안 (하이브리드)**: 기본은 Flash, 복잡한 쿼리(COMPLEX, 면책조항 해석 등)는 Pro로 라우팅.

#### 투표 결과

| 페르소나 | 투표 | 의견 |
|----------|------|------|
| 헤르메스 | **C안** | Flash는 단순 검색에 충분하지만, 복잡한 조항 해석이 필요한 경우 품질 차이가 있습니다. 쿼리 라우터가 이미 유형을 분류하니 라우팅 비용은 미미합니다 |
| 오딘 | **A안 (베타), C안 (정식)** | 비용 구조가 안정화될 때까지 Flash로 운영하고, 캐싱 효과를 확인한 후 하이브리드로 전환. Pro는 Flash의 10배 비용입니다 |
| 아르고스 | **C안** | 골든 테스트셋에서 Flash와 Pro의 정확도 차이를 측정해야 합니다. 차이가 5% 미만이면 Flash만으로 충분합니다 |
| 비너스 | **C안** | Gemini 관점에서, Flash 2.0은 이전 세대 대비 크게 향상되었습니다. 대부분 Flash로 충분하지만, 복잡한 비교 질의는 Pro가 안정적입니다 |
| 로키 | **A안** | 모델이 복잡해지면 공격 표면이 넓어집니다. Pro 라우팅 로직 자체가 추가 취약점입니다. 단순하게 가세요 |
| 김현장 | **C안** | 속도가 빠르면서 정확하면 됩니다. 기술적 구분은 모르겠고, 결과물이 좋으면 됩니다 |
| 박신입 | **A안** | 비용이 적은 게 좋겠습니다. 아직 사용자가 적을 때 비용을 줄여야 합니다 |
| 강베테 | **C안** | 정확도가 돈입니다. 오답 하나가 비용 절감보다 큰 손해입니다 |
| 이심사 | **의견 없음** | 기술적 판단에 따르겠습니다 |
| 정검사 | **의견 없음** | 어느 모델이든 출력 필터가 작동하면 됩니다 |
| 최변호 | **의견 없음** | 법적으로는 모델 선택이 아니라 출력 품질이 중요합니다 |

#### 최종 결정: **단계적 전환 (A안 -> C안)**

**확정 모델 전략**:

```
Phase 0~2 (베타 기간): Flash 단독
  - 비용 구조 안정화 우선
  - 골든 테스트셋으로 Flash vs Pro 정확도 비교 수행
  - 캐싱 효과 측정 (비용 절감률 확인)

Phase 3 (정식 출시): 데이터 기반 결정
  - Flash vs Pro 정확도 차이 > 5%: 하이브리드(C안) 적용
  - Flash vs Pro 정확도 차이 <= 5%: Flash 유지(A안)
  - 하이브리드 적용 시 라우팅 기준: 쿼리 라우터가 COMPLEX로 분류하거나
    면책/비교 키워드 포함 시 Pro, 나머지 Flash
```

**C안 찬성 5 / A안 찬성 3 / 의견 없음 3** -- 단계적 전환안으로 전원 수용

---

## Part 3. 최종 실행 계획서 (8주 로드맵 확정)

### Phase 0: 법적 인프라 + 기반 (Week 1-2)

**Go/No-Go 게이트**: 이용약관 + 개인정보처리방침 변호사 서명 완료

| 주차 | 작업 | 담당 | 완료 기준 |
|------|------|------|-----------|
| W1 | IT 전문 변호사 선임 | 제이회장님 | 계약 체결 |
| W1 | 이용약관 초안 작성 | 외부(변호사) + 아누 | "검색 서비스" 정의, 면책 조항, 환불 정책 포함 |
| W1 | 개인정보처리방침 초안 | 외부(변호사) | 수집 항목, 역외 전송 고지, 보관 기간 명시 |
| W1 | 답변 출력 필터 구현 | 1팀(헤르메스) | 단정 표현 10종 자동 치환 작동 |
| W1-2 | 쿼리 로그 개인정보 마스킹 | 1팀(헤르메스) | 실명 패턴 3종 자동 필터 |
| W2 | 법적 문서 최종 검토 + 서명 | 외부(변호사) | 법률 검토 완료 |
| W1-2 | 골든 테스트셋 1차 구축 시작 | 아르고스 | 100건 레이블링 완료 |
| W1 | 배상책임보험(E&O) 견적 조회 | 제이회장님 | 3곳 비교 견적 |
| W1 | 보험협회 사전 소통 | 제이회장님 | 연락 완료 (회신 대기 가능) |

**Phase 0 -> Phase 1 진입 조건**:
- 이용약관 + 개인정보처리방침 최종본 확정
- 답변 출력 필터 작동 확인
- 쿼리 로그 마스킹 작동 확인

---

### Phase 1: 기술 핵심 (Week 2-4)

**Go/No-Go 게이트**: 골든 테스트셋 200건 기준 정확도 85% 이상 + FLAT 대비 비용 80% 이상 절감

| 주차 | 작업 | 담당 | 완료 기준 |
|------|------|------|-----------|
| W2-3 | **CL-1: 구조 인식 청킹** | 1팀(헤르메스) | 조항 패턴 5종 인식 + 단서조항 30종 보존 |
| W2-3 | **CL-2: 상품 버전 관리** | 2팀(오딘) | effectiveDate.end 자동 설정 + 실손 세대 메타데이터 |
| W3 | **CL-1: 전체 재인덱싱** | 1팀 + 2팀 합동 | 45만 청크 신규 청킹 적용 재처리 |
| W3-4 | **CL-3: ANN 인덱스 전환** | 2팀(오딘) | TREE_AH 인덱스 빌드 + 기존 인덱스 교체 |
| W3-4 | **CL-3: 정확 일치 캐싱** | 2팀(오딘) | 캐시 히트율 측정 시작 + 무효화 로직 |
| W2-3 | **CL-6: Rate Limiting** | 1팀 또는 2팀 | 분/시/일 제한 작동 + 429 반환 + 관리자 알림 |
| W2-3 | **CL-6: 프롬프트 인젝션 필터** | 1팀 또는 2팀 | 한/영 인젝션 패턴 차단 + 시스템 프롬프트 격리 |
| W3 | **CL-6: Firestore 보안규칙** | 2팀(오딘) | 공개 읽기 차단 + 인증 필수화 |
| W2 | **CL-10: 특약 경고 삽입** | 1팀(헤르메스) | 시스템 프롬프트 수정 + UI 경고 배너 |
| W3 | **모니터링 + 알림** | 2팀(오딘) | Cloud Monitoring + Budget Alert + Slack 알림 |
| W2-4 | **골든 테스트셋 200건 완성** | 아르고스 | 200건 레이블링 + 자동 테스트 스크립트 |
| W4 | **통합 검증** | 아르고스 + 전팀 | 테스트셋 200건 정확도 85%+ 확인 |

**1팀/2팀 병렬 배치 (충돌 방지)**:

```
1팀 (헤르메스):                    2팀 (오딘):
W2-3: CL-1 청킹 재설계             W2-3: CL-2 버전 관리
W2-3: CL-6 보안 (분담)             W3:   CL-6 보안 (분담)
W2:   CL-10 특약 경고              W3-4: CL-3 ANN + 캐싱
W3:   재인덱싱 (합동)              W3:   재인덱싱 (합동)
W4:   통합 검증 지원               W3:   모니터링 구축
```

**Phase 1 -> Phase 2 진입 조건**:
- 골든 테스트셋 200건 정확도 85% 이상
- ANN 인덱스 전환 완료 + 비용 절감 확인
- Rate Limit 작동 확인
- 보안규칙 재설정 확인

---

### Phase 2: 검색 품질 + 운영 체계 + 1차 베타 (Week 4-6)

**Go/No-Go 게이트**: 1차 베타 치명적 버그 0건 + 오답률 10% 미만

| 주차 | 작업 | 담당 | 완료 기준 |
|------|------|------|-----------|
| W4-5 | **CL-5: 검색 정밀도 개선** | 1팀(헤르메스) | 동적 임계값 적용 + 미등록 상품 사전검증 |
| W4-5 | **CL-9: 별표 인덱싱** | 2팀(오딘) | Camelot/Tabula 파싱 + 별표 전용 컬렉션 |
| W4-5 | **CL-7: 오답 피드백 UI** | 1팀(헤르메스) | "틀렸어요" 버튼 + 오답 유형 선택 + 수집 |
| W4-5 | **CL-7: 원클릭 재인덱싱** | 2팀(오딘) | 관리자 약관 업로드 -> 자동 인덱싱 파이프라인 |
| W5-6 | **1차 베타 테스트** | 제이회장님 + 전팀 | 5-10명 2주 사용, 피드백 수집 |
| W5 | 상품명 자동완성 UI | 1팀 또는 2팀 | 상품 선택 드롭다운 작동 |
| W6 | 1차 베타 결과 분석 + 수정 | 전팀 | 치명적 버그 전건 수정 |

**Phase 2 -> Phase 3 진입 조건**:
- 1차 베타 치명적 버그 0건
- 오답률(피드백 기준) 10% 미만
- 별표 파싱 품질 검증 통과 (수술분류표 20건 테스트)

---

### Phase 3: 차별화 + 2차 베타 + 출시 (Week 6-8)

**Go/No-Go 게이트 (최종 출시 판정)**: 2차 베타 NPS 40+ 또는 유료 전환 의향 60%+

| 주차 | 작업 | 담당 | 완료 기준 |
|------|------|------|-----------|
| W6-7 | **CL-8: 2상품 비교표** | 1팀(헤르메스) | 2상품 나란히 비교 UI + 조항별 매칭 |
| W6-7 | **CL-8: TABLE_QUERY 기본** | 2팀(오딘) | 보험료 테이블 조회 MVP |
| W6 | 정확도 벤치마크 (ChatGPT vs 약관AI) | 아르고스 | 100문항 비교 결과 공개용 데이터 확보 |
| W6 | 도메인 특화 UX 적용 | 비너스 자문 + 1팀 | 조문 하이라이트, 보장/면책 색상 구분 |
| W7-8 | **2차 베타 테스트** | 제이회장님 + 전팀 | 30-50명 2주 사용 |
| W7 | 앰배서더 프로그램 준비 | 제이회장님 | 베타 참여자 -> 앰배서더 전환 계획 |
| W7 | 온보딩 가이드 + 예시 질의 | 비너스 자문 + 1팀 | 가이드 페이지 + 예시 10건 |
| W7 | Flash vs Pro 정확도 비교 | 아르고스 | 데이터 기반 모델 결정 |
| W8 | **2차 베타 결과 분석** | 전팀 | NPS/유료 전환 의향 조사 |
| W8 | **최종 출시 판정** | 전원 | Go/No-Go 게이트 통과 여부 |
| W8 | **정식 출시** (게이트 통과 시) | 전팀 | 유료 서비스 오픈 |

**정식 출시 조건**:
- 2차 베타 NPS 40 이상 **또는** 유료 전환 의향 60% 이상
- 골든 테스트셋 500건 기준 정확도 85% 이상 유지
- 치명적 미해결 버그 0건
- 법적 문서 전건 게시 완료
- 배상책임보험 가입 완료

---

### 담당팀 배정 확정 (전체 요약)

| Phase | 1팀 (헤르메스) | 2팀 (오딘) | 외부/기타 |
|-------|----------------|------------|-----------|
| **0** | 출력 필터, 개인정보 마스킹 | - | 변호사(법적 문서), 아르고스(테스트셋) |
| **1** | CL-1 청킹, CL-6 보안(분담), CL-10 | CL-2 버전, CL-3 비용, CL-6(분담), 모니터링 | 아르고스(테스트셋 200건) |
| **2** | CL-5 정밀도, CL-7 피드백UI | CL-9 별표, CL-7 재인덱싱 | 1차 베타(제이회장님) |
| **3** | CL-8 비교표, UX | CL-8 TABLE_QUERY | 2차 베타(제이회장님), 벤치마크(아르고스) |

---

## Part 4. 미팅 전체 요약 (Executive Summary)

### 5라운드 미팅 개요

| 항목 | 내용 |
|------|------|
| **미팅 목적** | InsuWiki 약관AI 유료 출시 전 리스크 발굴 + 대응 방안 수립 |
| **참석자** | 11명 (기술 4, 보안 1, 외부 현장/법률/규제 6) |
| **총 라운드** | 5라운드 (시나리오 발굴 -> 분석 -> 우선순위 -> 대응방안 -> 최종합의) |
| **기간** | 2026-03-03 (1일 집중) |

### 리스크 발견 통계

| Tier | 건수 | 비율 | 의미 |
|------|------|------|------|
| CRITICAL (Risk >= 20) | 32건 (고유 25건) | 21% | 출시 전 반드시 해결 |
| HIGH (Risk 15~19) | 37건 | 24% | 출시 전 대응 방안 필수 |
| MEDIUM (Risk 10~14) | 51건 | 33% | 출시 후 3개월 내 해결 |
| LOW (Risk < 10) | 36건 | 23% | 백로그 |
| **합계** | **156건** | **100%** | 9개 카테고리 |

### 핵심 결론 5줄

1. **현 상태 즉시 출시는 불가**. 법적 문서 미비 + 청킹 결함 + 비용 구조 파탄 + 보안 부재의 4중 차단 사유 존재.
2. **8주 로드맵 실행 시 조건부 출시 가능**. 10개 CRITICAL 클러스터를 4개 Phase로 해소, Phase 0+1(4주) 완료가 최소 출시 조건.
3. **답변 방식은 "원문 기반 구조화 검색"으로 확정**. 판단형 답변은 법적/기술적 리스크가 너무 높아 전원 합의로 배제. 원문 요약만 허용.
4. **무료 베타(4주) -> 유료 전환 전략 확정**. 베타에서 품질 검증 + 피드백 수집 + 앰배서더 양성. 유료 소규모 런칭보다 리스크가 낮음.
5. **10개 클러스터가 25개 CRITICAL을 커버**. 개별 이슈 대응이 아닌 근본 원인 클러스터 단위 해결로 효율적 리소스 배분.

### 3대 의사결정 결과

| # | 안건 | 결정 | 투표 결과 |
|---|------|------|-----------|
| 1 | AI 답변 방식 | 구조화된 원문 제시 + 원문 기반 요약 (판단형 배제) | 전원 합의 |
| 2 | 베타 전략 | 무료 베타 4주 선행 -> 유료 전환 | 전원 합의 |
| 3 | 모델 선택 | 베타 기간 Flash -> 정식 출시 시 데이터 기반 결정 | 다수결 수용 |

### 남은 과제 (8주 이후)

| # | 과제 | 시급성 | 비고 |
|---|------|--------|------|
| 1 | 보험증권 OCR 기능 | 중기 | CL-10 구조적 한계 근본 해결 |
| 2 | 시맨틱 캐싱 | 중기 | 정확 일치 캐싱의 한계 극복 |
| 3 | 약관 자동 크롤링 | 중기 | 수동 운영의 한계 (52사 x 40상품) |
| 4 | 3상품 이상 비교 | 단기 | 2상품 비교 안정화 후 |
| 5 | Cross-Encoder Re-ranking | 중기 | AMBIGUOUS 추가 감소 |
| 6 | 임베딩 모델 마이그레이션 | 대기 | text-embedding-004 단종 시 실행 |
| 7 | GA 지점장 팀 관리 기능 | 장기 | B2B 확장 시 필요 |
| 8 | COMPLEX 쿼리 분해 | 단기 | 비용 안정 확인 후 |

---

## Part 5. 각 페르소나 최종 코멘트

**헤르메스 (1팀장)**:
"5라운드에 걸쳐 156건의 리스크를 발굴하고 10개 클러스터로 수렴시킨 것은 의미있는 작업이었습니다. 핵심은 CL-1(청킹)입니다. 이것이 모든 품질의 뿌리이고, Phase 1에서 이것을 완벽하게 해내면 나머지는 따라옵니다."

**오딘 (2팀장)**:
"인프라와 비용 구조를 바로잡는 것이 사업 존속의 전제입니다. FLAT 인덱스와 캐싱 없이 유료 서비스를 운영하는 것은 밑빠진 독에 물 붓기입니다. CL-2와 CL-3을 2주 안에 끝내겠습니다."

**아르고스 (테스터)**:
"골든 테스트셋이 모든 개선의 측정 도구입니다. '개선했다'고 말하려면 숫자가 있어야 합니다. 500건 테스트셋 완성이 품질 보증의 기반입니다."

**비너스 (디자인센터)**:
"기능이 아무리 좋아도 UX가 나쁘면 사용자는 떠납니다. 모바일에서 3초 안에 읽을 수 있는 구조화된 답변, 보장/면책 시각 구분, 조문 하이라이트 -- 이것이 '돈 낼 가치'를 만듭니다."

**로키 (레드팀)**:
"완벽한 보안은 없습니다. 우리가 한 것은 공격 비용을 높이고 피해를 제한하는 것입니다. Rate limit, 인젝션 필터, 보안규칙은 최소 방어선일 뿐이며, 서비스 운영 중 지속적 모니터링이 진짜 보안입니다."

**김현장 (GA 15년)**:
"비교표가 나오면 GA 설계사들이 쓸 겁니다. 8주 후가 기대됩니다. 베타에 저를 꼭 넣어주세요. 현장 관점의 피드백은 제가 가장 잘 줄 수 있습니다."

**박신입 (2년차)**:
"온보딩 가이드와 예시 질의만 있으면 저 같은 신입도 활용할 수 있습니다. AI가 원문을 찾아주면 저는 그걸 보고 공부할 수 있어요. 학습 도구로서의 가치도 큽니다."

**강베테 (전속 MDRT)**:
"결론은 하나입니다. '이걸 쓰면 상담이 빨라지고 정확해진다' -- 이 한 문장을 증명하세요. 벤치마크 숫자, 비교표, 출처 표시가 그 증거입니다."

**이심사 (보험협회)**:
"보험업계는 보수적입니다. 선제적 소통이 100배 쌉니다. 보험협회에 '이런 서비스를 준비 중이다'라고 먼저 알리면, 나중에 문제가 생겨도 방어가 됩니다."

**정검사 (금감원)**:
"3중 방어선(기술적 통제 + 계약적 통제 + 재무적 통제)을 갖추면, 금감원 소명에서도 '합리적 주의의무'를 다했다고 주장할 수 있습니다. 이 프레임워크를 유지하세요."

**최변호 (변호사)**:
"이번 주에 IT 전문 변호사를 선임하세요. AI 서비스 이용약관은 일반 변호사가 못 합니다. 2주면 법적 인프라가 갖춰집니다. 그것이 출시의 첫 번째 열쇠입니다."

---

## 부록: 연쇄 시나리오 최종 정리 (로키 제출)

라운드 3에서 로키가 지적한 4가지 연쇄 시나리오의 대응 상태:

| # | 연쇄 시나리오 | 관련 클러스터 | Phase | 대응 상태 |
|---|-------------|---------------|-------|-----------|
| 1 | A-25 + E-22: 미가입 특약 안내 -> 신입 과신 -> 소송 | CL-10 + CL-4 | 0+1 | 특약 경고(CL-10) + 면책 체계(CL-4)로 2중 차단 |
| 2 | B-28 + A-7: 미등록 상품 유사 반환 + 실손 세대 혼동 | CL-5 + CL-2 | 1+2 | 미등록 사전검증(CL-5) + 세대 메타데이터(CL-2) |
| 3 | H-8 + G-1: DoW + FLAT 인덱스 = 비용 폭발 | CL-6 + CL-3 | 1 | Rate limit(CL-6) + ANN 전환(CL-3) |
| 4 | I-9 + E-24: 부정 후기 -> 차별성 의문 -> 유료 전환 붕괴 | CL-8 + 베타 | 3 | 비교표(CL-8) + 2단계 베타 + 앰배서더 |

4개 연쇄 시나리오 모두 8주 로드맵 내에서 대응 완료.

---

## 최종 선언

약관AI 심층 검증 미팅 5라운드를 마칩니다.

**판정**: 조건부 Go -- Phase 0+1 완료(4주) 후 베타 시작, 8주 후 정식 출시 목표.

**핵심 수치**:
- 발견 리스크: 156건 (9개 카테고리)
- CRITICAL: 25개 고유 이슈 -> 10개 클러스터로 수렴
- 실행 계획: 4 Phase / 8주 / 1팀+2팀 병렬
- MVP 14개 항목 확정
- 3대 의사결정 전원 합의

다음 액션:
1. **즉시**: IT 전문 변호사 선임 + 보험협회 사전 소통
2. **이번 주**: Phase 0 착수 (법적 문서 + 출력 필터)
3. **2주 후**: Phase 1 착수 (기술 핵심)
4. **4주 후**: 1차 베타 시작
5. **8주 후**: 정식 출시 판정

---

*작성: 아누 (개발실장) / 2026-03-03*
*라운드 5 참석자: 11명 (기술 4, 보안 1, 외부 6)*
*상위 문서: `memory/meetings/2026-03-03-round4-response-plans.md`*
*전체 미팅 문서 체인: round1(시나리오) -> round2(분석) -> round3(우선순위) -> round4(대응) -> round5(합의)*