# 장애 포스트모템 템플릿

> 이 문서는 장애 발생 후 원인 분석 및 재발 방지를 위한 포스트모템 양식입니다.

---

## 📋 기본 정보

| 항목 | 내용 |
|------|------|
| **장애 ID** | `INC-YYYY-MM-DD-NNN` |
| **장애명** | (장애 요약) |
| **발생 일시** | YYYY-MM-DD HH:MM |
| **복구 일시** | YYYY-MM-DD HH:MM |
| **영향 범위** | (서비스/사용자/기능) |
| **장애 등급** | P1 (치명적) / P2 (심각) / P3 (보통) / P4 (경미) |
| **작성자** | (이름) |
| **검토자** | (이름) |

---

## 📝 요약

### 한 줄 요약
> (장애를 한 문장으로 요약)

### 영향도
- **사용자 영향**: (예: 1,000명의 사용자가 로그인 불가)
- **비즈니스 영향**: (예: 약 30분간 주문 불가, 예상 손실액)
- **시스템 영향**: (예: API 서버 응답 불가)

---

## ⏱️ 타임라인

> 모든 시간은 KST (UTC+9) 기준

| 시간 | 이벤트 | 작업자 | 비고 |
|------|--------|--------|------|
| HH:MM | 🚨 장애 감지 | (이름) | (감지 방법: 모니터링/사용자 신고) |
| HH:MM | 🔍 원인 파악 시작 | (이름) | |
| HH:MM | 📢 관련자 알림 | (이름) | (알림 대상) |
| HH:MM | 🔧 조치 시작 | (이름) | (조치 내용) |
| HH:MM | ✅ 서비스 복구 | (이름) | |
| HH:MM | 🔄 정상 확인 | (이름) | |

---

## 🔍 원인 분석

### 직접 원인 (Direct Cause)
> 장애를 직접적으로 발생시킨 원인

- (원인 1)
- (원인 2)

### 근본 원인 (Root Cause)
> 5 Whys 기법으로 파악한 근본 원인

1. **Why 1**: 왜 (직접 원인)이 발생했나?
   - 답변: 
2. **Why 2**: 왜 (Why 1의 답변)이 발생했나?
   - 답변: 
3. **Why 3**: 왜 (Why 2의 답변)이 발생했나?
   - 답변: 
4. **Why 4**: 왜 (Why 3의 답변)이 발생했나?
   - 답변: 
5. **Why 5**: 왜 (Why 4의 답변)이 발생했나?
   - 답변: 

### 근본 원인 요약
> (한 문장으로 요약)

---

## 🛠️ 조치 내용

### 즉시 조치 (Immediate Fix)
> 장애 복구를 위해 즉시 수행한 조치

1. (조치 1)
2. (조치 2)
3. (조치 3)

### 임시 조치 (Workaround)
> 근본 해결 전까지 적용한 임시 조치

- (임시 조치 내용)

### 근본 해결 (Permanent Fix)
> 재발 방지를 위한 근본적 해결책

- (근본 해결 내용)

---

## 🚫 재발 방지 대책

### 기술적 대책

| 항목 | 내용 | 담당자 | 완료 목표일 | 상태 |
|------|------|--------|-------------|------|
| 1 | (대책 내용) | (이름) | YYYY-MM-DD | ⏳ 진행중 |
| 2 | (대책 내용) | (이름) | YYYY-MM-DD | ✅ 완료 |
| 3 | (대책 내용) | (이름) | YYYY-MM-DD | 📋 계획 |

### 프로세스 개선

| 항목 | 개선 전 | 개선 후 | 담당자 | 상태 |
|------|---------|---------|--------|------|
| 1 | (기존 프로세스) | (개선된 프로세스) | (이름) | (상태) |

### 모니터링/알림 강화

- [ ] (새로운 모니터링 항목 1)
- [ ] (알림 임계값 조정)
- [ ] (대시보드 추가)

---

## 📚 교훈 및 배운 점

### 잘한 점 (What went well)
1. (잘한 점 1)
2. (잘한 점 2)

### 개선할 점 (What could be improved)
1. (개선할 점 1)
2. (개선할 점 2)

### 새로 알게 된 점
- (새로 알게 된 내용)

---

## 📎 첨부 자료

- **로그 파일**: (링크 또는 경로)
- **모니터링 스크린샷**: (링크)
- **관련 문서**: (링크)
- **코드 변경**: (PR/커밋 링크)

---

## ✅ 액션 아이템

> 포스트모템에서 도출된 후속 작업 목록

| # | 액션 아이템 | 담당자 | 우선순위 | 완료 목표일 | 상태 |
|---|-------------|--------|----------|-------------|------|
| 1 | | | P1/P2/P3 | YYYY-MM-DD | ⏳ |
| 2 | | | | | ✅ |
| 3 | | | | | 📋 |

---

## 👥 참여자

| 이름 | 역할 | 참여 시간 |
|------|------|-----------|
| (이름) | (역할) | HH:MM ~ HH:MM |
| (이름) | (역할) | HH:MM ~ HH:MM |

---

## 📅 리뷰 이력

| 일자 | 리뷰어 | 비고 |
|------|--------|------|
| YYYY-MM-DD | (이름) | (초안 작성) |
| YYYY-MM-DD | (이름) | (리뷰 완료) |

---

> **작성 가이드**
> - 모든 시간은 KST (UTC+9) 기준으로 작성
> - 비난 없는 문화 (Blameless Culture): 개인 비난 없이 시스템/프로세스 개선에 집중
> - 사실 기반: 추측이 아닌 확인된 사실만 기록
> - 구체적: "느림" 대신 "응답 시간 30초"와 같이 구체적으로 표현
> - 액션 아이템은 담당자와 완료일을 반드시 지정
