# InsuRo 소식지 인식 교정 사전 확장 (A+C 조합)

## 작업 레벨: Lv.1

## 프로젝트
- InsuRo: `/home/jay/projects/InsuRo`
- 서버: `/home/jay/projects/InsuRo/server`

## 개선 설명
소식지/보험료 데이터 AI 인식 시 보험 용어 오인식을 줄이기 위해:
A) 교정 사전 대폭 확장 (현재 9개 → 50개+)
C) few-shot 예시 파일 생성 → 프롬프트에 포함

## 수정 사항

### 1. INSURANCE_TEXT_CORRECTIONS 확장
파일: `server/main.py` 라인 3845 부근

현재 9개만 등록:
```python
INSURANCE_TEXT_CORRECTIONS = {
    "앎주치": "암주치", "뇨혈관": "뇌혈관", "심귄경색": "심근경색",
    "잔여걔월": "잔여개월", "보혐료": "보험료", "갱싞": "갱신",
    "비갱싞": "비갱신", "진단굠": "진단금", "수슬비": "수술비",
}
```

아래 항목 추가 (발견된 오인식 + 예상 오인식):
```python
# 발견된 실제 오인식
"강신장": "갱신형", "더핏": "더블", "강신형": "갱신형",

# 보험 용어 OCR 오류 예상 패턴
"후유장헤": "후유장해", "후유장혜": "후유장해",
"질벙": "질병", "상헤": "상해", "사먕": "사망",
"입웡": "입원", "통웡": "통원", "수슐": "수술",
"보장개시일": "보장개시일",  # 정상
"남입": "납입", "납입면체": "납입면제", "만기환굽": "만기환급",
"해악": "해약", "해약환급굠": "해약환급금",
"피보험자": "피보험자",  # 정상
"피보혐자": "피보험자", "보혐금": "보험금",
"보혐기간": "보험기간", "보혐가입": "보험가입",
"특악": "특약", "추가특악": "추가특약",
"갱싞형": "갱신형", "비갱싞형": "비갱신형",
"순수보장형": "순수보장형",  # 정상
"만기환굽형": "만기환급형", "혼합형": "혼합형",  # 정상
"일반상헤": "일반상해", "교통상헤": "교통상해",
"뇨졸중": "뇌졸중", "뇌줄중": "뇌졸중",
"급성심귄경색": "급성심근경색", "심귄경색증": "심근경색증",
"일반암": "일반암",  # 정상
"유사암": "유사암",  # 정상
"뇨혈관질환": "뇌혈관질환", "허혈성심장질환": "허혈성심장질환",  # 정상
"치료비": "치료비",  # 정상
"진단비": "진단비",  # 정상
"실손의료비": "실손의료비",  # 정상
"입웡일당": "입원일당", "통웡비": "통원비",
"3대질벙": "3대질병", "7대질벙": "7대질병",
```

★ 정상 항목(주석 "정상")은 제외하고 실제 오인식 패턴만 추가.
★ 교정 사전은 replace 방식이므로 정상 단어를 포함하면 안 됨.

### 2. few-shot 예시 파일 생성
파일: `server/skill_prompts/newsletter_parsing_guide.txt` (신규)

Vision 모델로 소식지 분석 시 프롬프트에 포함할 가이드:
```
[보험 문서 인식 주의사항]
- "강신장"은 "갱신형"의 오인식. 갱신형으로 교정
- "더핏"은 "더블"의 오인식. 더블로 교정
- 보험료 단위: 만원이 아닌 원 단위로 표기 (예: 1,000 = 1,000원)
- 보험사명 약어: DB=DB손해보험, ME=메리츠화재, KB=KB손해보험
- 담보명에서 괄호 안 비율은 정확히 추출 (예: 상해후유장해(3~100%))
- 숫자 구분: 보험료(월납)와 가입금액(만원)을 혼동하지 말 것
```

### 3. Vision 프롬프트에 가이드 포함
`server/main.py` — Vision 추출 시 프롬프트에 `newsletter_parsing_guide.txt` 내용을 포함:
- `_vision_extract_batch()` 함수의 프롬프트에 가이드 텍스트 추가
- `_smart_parse_file()` 함수의 AI 분석 프롬프트에도 추가

## affected_files
- `server/main.py` (수정 — INSURANCE_TEXT_CORRECTIONS 확장 + Vision 프롬프트에 가이드 포함)
- `server/skill_prompts/newsletter_parsing_guide.txt` (신규 — 소식지 파싱 가이드)

## 검증 시나리오
1. INSURANCE_TEXT_CORRECTIONS에 "강신장"→"갱신형", "더핏"→"더블" 포함 확인
2. 교정 사전 항목 수 30개 이상 확인
3. newsletter_parsing_guide.txt 파일 존재 확인
4. Vision 프롬프트에 가이드 내용이 포함되는지 grep 확인
5. 서버 import 정상
6. npm run build 성공