# AI 텍스트 인간화 연구 — AI 탐지 우회 전략

## 조사일: 2026-03-15
## 요청 배경: 제이회장님 출판팀 역량 — 표절률 0%, AI 탐지 0%

---

## 1. AI 탐지 도구 작동 원리

### 4가지 핵심 메커니즘
1. **퍼플렉시티(Perplexity)**: AI 글은 "다음 단어 예측"이 쉬움 → 퍼플렉시티 낮음. GPTZero 기준 85 이상 = 인간
2. **버스티니스(Burstiness)**: 인간은 문장 길이 편차 큼 (3단어~40단어). AI는 균일 (12~18단어)
3. **의미론적 핑거프린팅**: 문단을 벡터로 변환 → AI 모델 출력 코사인 유사도 비교
4. **문체 측정(Stylometry)**: 품사 비율, 기능어, 구두점 패턴, 어휘 다양성 등 500+ 신호

### 주요 도구 정확도 (2025-2026)
- GPTZero: 독립 테스트 70-80%
- Originality.ai: 96-98%, 패러프레이징도 60% 탐지
- Turnitin: 편집된 텍스트엔 20-63%로 급락
- GPT킬러 (한국어): 민감도 0.97, AUROC 0.94

### 학술 증명된 한계
- UMD 연구: "충분히 발전한 AI 탐지는 원리적으로 불가능"
- ICML 2024: 워터마킹도 제거 가능
- Stanford: 비원어민 글 61.3% AI로 오탐 (퍼플렉시티 기반 편향)

---

## 2. AI 글쓰기 탐지 패턴 (피해야 할 것들)

### 영어 금지 어휘
delve, tapestry, meticulous, nuanced, underscores, commendable, intricate, comprehensive, leverage, paramount, testament, embark, innovative, unparalleled, unwavering, realm, vital role

### 한국어 금지 어휘
"심층적으로 살펴보면", "복잡한 상호작용", "포괄적인 이해를 위해", "다각도로 분석하면", "~의 중요성을 강조한다", "혁신적인 접근방식", "세심한 검토가 필요", "이를 통해 알 수 있듯이", "지속 가능한", "이러한 맥락에서"

### 구조적 패턴
- "Not only A, but also B" 과다 사용
- 3단 나열 구조 집착
- 과도한 접속부사 (또한/더불어/아울러/한편)
- 볼드+불릿 구조
- 요약형 마무리 단락
- Em dash 남용

---

## 3. 효과적인 우회 전략 (효과순)

### Tier 1: 최고 효과
1. **인간 직접 편집**: 개인 경험·에피소드 삽입 → 탐지 원리적 불가능
2. **대화 기반 집필**: AI를 인터뷰어로, 대화 내용을 원재료로 편집
3. **문장 리듬 파괴**: 의도적 문장 길이 불규칙화

### Tier 2: 높은 효과
4. **AI 프롬프트 최적화**: 금지 패턴 명시, 구어체/산문체 요청
5. **AI 냄새 어휘 수동 교체**: 금지 목록 기반 검색-교체

### Tier 3: 보통~낮은 효과
6. **패러프레이징**: 5회 이상 재귀 패러프레이징 시 25%까지 하락
7. **상업용 인간화 도구**: Turnitin 등 고급 탐지기엔 불안정

---

## 4. 책 집필 권장 워크플로우

### 계층화된 AI 활용 모델
- 레이어 1: 리서치 (AI 80%)
- 레이어 2: 구조 설계 (AI 50% + 인간 50%)
- 레이어 3: 초안 작성 (AI 30% + 인간 70%)
- 레이어 4: 목소리·스타일 (인간 100%)

### AI 냄새 제거 편집 프로토콜
1. 어휘 치환 (15분) — 금지 목록 기반
2. 문장 리듬 파괴 (20분) — 문장 길이 불규칙화
3. 개인 에피소드 삽입 (25분) — 구체적 경험
4. 모순·예외 삽입 (10분) — AI는 깔끔한 논리 추구
5. 구어체 삽입 (10분) — 사투리/간투어/불완전 문장
6. 소리내어 읽기 테스트 (10분) — 최종 필터

---

## 5. 한국어 특수 고려사항
- 교착어 특성 → 영어 탐지 알고리즘 구조적 약점
- 어미 변형 풍부 → 퍼플렉시티 측정 방해
- 경어법 체계 혼용 → 인간적 특성
- 주어 생략 자연스러움 → AI의 "주어 명시" 패턴과 역방향
- 한국어 특화 도구(isgen.ai, GPT킬러) 존재하나 완벽하지 않음

## 소스
- GPTZero, Originality.ai, Turnitin 공식 문서
- UMD arXiv 2023: "Can AI-Generated Text be Reliably Detected?"
- ICML 2024: "Watermarks in the Sand"
- NeurIPS 2023 DIPPER 패러프레이저 연구
- Stanford/PMC: 비원어민 편향 연구
- AI타임스: GPT킬러 94% 정확도 보도