# task-932.1: 자막 없는 유튜브 영상 내용 추출 + 요약 (한정위임)

## 배경
- InsuWiki에서 유튜브 요약 기능을 제공하고 있음
- 자막(caption)이 없는 유튜브 영상은 요약이 안 되는 문제 발생
- 자막 없는 영상에서도 내용을 추출하고 요약할 수 있는 방법이 필요

## 대상 영상
- URL: https://www.youtube.com/watch?v=dCIc9mkFCLw
- 특징: 자막(CC) 미제공 영상

## 작업 범위 (한정위임 — 끝까지 진행)

### Phase 1: 리서치 — 자막 없는 영상에서 내용 추출 방법 조사
- yt-dlp로 오디오 다운로드 가능 여부 확인
- Whisper (OpenAI STT) 또는 다른 음성→텍스트 변환 도구 조사
- 서버 환경에서 실행 가능한 방법 선정
- 필요한 패키지 설치 (pip install 등)

### Phase 2: 구현 — 오디오 추출 + 텍스트 변환
- 대상 영상에서 오디오 추출 (yt-dlp 또는 대안)
- 음성→텍스트 변환 (Whisper 또는 대안) 실행
- 한국어 음성인 경우 한국어 모델 사용
- 변환된 텍스트를 파일로 저장

### Phase 3: 요약 — 추출된 텍스트 기반 요약
- 변환된 전체 텍스트를 바탕으로 핵심 내용 요약
- 요약 결과를 보고서로 작성
- 보고서 경로: `/home/jay/workspace/memory/reports/task-932.1.md`

### Phase 4 (선택): 인슈위키 적용 방안 제안
- 위에서 확인한 방법을 InsuWiki 유튜브 요약 기능에 통합할 수 있는 방안 간략 제안
- 인슈위키 경로: `/home/jay/projects/insuwiki/`
- 현재 유튜브 요약 로직이 어디에 있는지 확인하고, 자막 없는 경우의 fallback으로 이 방법을 추가하는 방안

## 제약사항
- 서버 환경: Linux (Ubuntu), Python 사용 가능
- 필요 시 pip install로 패키지 설치 가능
- ffmpeg이 설치되어 있는지 확인 필요 (Whisper 의존성)
- 오디오 파일은 작업 완료 후 삭제하지 말 것 (제이회장님 확인용)

## 산출물
1. 추출된 텍스트 전문 (파일)
2. 요약 보고서 (`memory/reports/task-932.1.md`)
3. (선택) InsuWiki 적용 방안

## 참고
- Whisper 설치: `pip install openai-whisper` 또는 `pip install faster-whisper`
- yt-dlp 설치: `pip install yt-dlp`
- Whisper 한국어: `--language ko` 옵션
- 서버 GPU 없을 수 있음 → CPU 모드 또는 tiny/base/small 모델 사용
