# task-932.2: GTX 1060 GPU 활용 Whisper 최적화 (한정위임)

## 배경
- task-932.1에서 faster-whisper로 유튜브 음성 추출 성공
- 그러나 GPU float16 미지원으로 **CPU+int8 모드로 fallback** 실행됨
- GTX 1060 6GB는 CUDA Compute Capability 6.1 (Pascal 아키텍처)
- float16 연산 자체는 지원하지만, faster-whisper/CTranslate2의 특정 구현이 호환 안 될 수 있음
- **목표: GTX 1060에서 GPU를 최대한 활용하는 방법 찾기**

## 서버 환경 (task-932.1에서 확인됨)
- GPU: NVIDIA GTX 1060 6GB
- CUDA: 12.2
- faster-whisper: 1.2.1
- ffmpeg: 7.0.2
- OS: Linux

## 작업 범위 (한정위임 — 끝까지 진행)

### Phase 1: GPU 미작동 원인 정밀 분석

1. GTX 1060의 실제 CUDA Compute Capability 및 지원 연산 확인
   - `nvidia-smi` 상세 정보
   - CUDA float16 vs float32 vs int8 지원 범위
2. faster-whisper / CTranslate2가 요구하는 GPU 조건 확인
   - 공식 문서/이슈에서 GTX 1060 호환성 정보 검색
   - float16 대신 float32나 int8_float16 등 대안 compute_type 확인
3. 에러 로그 재현: `device="cuda", compute_type="float16"`으로 실행 시 정확한 에러 메시지 캡처

### Phase 2: GPU 활용 가능한 설정 조합 탐색

가능한 설정 조합을 **실제 테스트**하여 작동 여부 확인:

1. `device="cuda", compute_type="float32"` — GPU + float32 (메모리 더 많이 쓰지만 호환성 높음)
2. `device="cuda", compute_type="int8_float16"` — 혼합 정밀도
3. `device="cuda", compute_type="int8"` — GPU + int8 양자화
4. `device="cuda", compute_type="int8_float32"` — GPU + int8 + float32 혼합
5. 다른 모델 크기(tiny, base, small)별로 GPU 메모리 적합성 확인
   - 6GB VRAM에서 어떤 모델까지 올라가는지

### Phase 3: 성능 벤치마크

작동하는 설정 조합이 발견되면, **동일한 오디오 샘플**로 벤치마크:
- 처리 시간 비교 (CPU int8 vs GPU 최적 설정)
- 인식 정확도 비교 (WER이 아니더라도 눈으로 확인 가능한 수준)
- VRAM 사용량 (`nvidia-smi` 모니터링)
- 모델 크기별 (tiny/base/small/medium) GPU 적합성

### Phase 4: 최적 설정 문서화 + 적용

1. **최적 설정 확정**: GPU 활용 가능한 최고 성능 조합
2. **설정 파일/환경변수**: 다른 스크립트에서도 재사용 가능하도록 문서화
3. task-932.1의 코드에 적용 방안 제시 (직접 수정은 선택적)

## 테스트용 오디오 파일
- task-932.1에서 생성된 파일: `/home/jay/workspace/teams/dev4/task-932.1/audio.wav` (1.5GB, 2시간16분)
- 벤치마크용으로는 앞부분 5분만 잘라서 테스트해도 됨 (`ffmpeg -t 300`)

## 제약사항
- 시스템 패키지 설치 시 주의 (CUDA/cuDNN 버전 변경 금지)
- faster-whisper 또는 CTranslate2 버전 업그레이드는 허용 (pip)
- 다른 Whisper 구현체(whisper.cpp, openai-whisper 등) 비교도 허용
- GPU 드라이버 변경 금지

## 산출물
1. GPU 활용 가능 여부 및 최적 설정 보고서: `memory/reports/task-932.2.md`
2. 벤치마크 결과 (처리시간/VRAM/모델크기별)
3. 권장 설정 요약
