# 오늘의 AI 한입 Voice Library v1 — 초안

작성일: 2026-05-03
상태: 대표님 1차 선택 조합 반영. 동일성 테스트 샘플 생성 완료, 대표님 최종 청취 확인 대기.

## 선택 조합

- TTS 제공자: Gemini TTS
- 모델: `gemini-3.1-flash-tts-preview`
- 딸 voiceName: `Zephyr`
- 아버지 voiceName: `Charon`

## 선택 배경

대표님이 Gemini TTS가 기존 ElevenLabs premade/Edge 계열보다 훨씬 낫다고 평가했고, 후보 중 다음 조합을 지정했다.

- 딸: Zephyr
- 아빠: Charon

## 역할별 고정 프롬프트

### 딸 Zephyr

```text
한국의 젊은 성인 딸입니다. 밝고 따뜻하지만 과장하지 않습니다. 아빠에게 편하게 말하듯 자연스럽게 말하세요. 강사, 뉴스앵커, 중년 여성 내레이터처럼 들리면 안 됩니다.
유튜브 쇼츠의 친한 부녀 대화 한 줄입니다. 이전 승인 후보와 같은 인물/관계의 목소리로 유지하세요. 실제로 상대에게 말하듯 연기하세요. 한국어 억양은 자연스럽게, 호흡은 짧게, 감정은 과하지 않게 유지하세요.
```

### 아버지 Charon

```text
한국의 50~60대 아버지입니다. 딸에게 편하게 묻고 반응하는 말투입니다. 따뜻하고 자연스럽게 말하세요. 회사 발표자나 뉴스 남성 내레이터처럼 읽으면 안 됩니다.
유튜브 쇼츠의 친한 부녀 대화 한 줄입니다. 이전 승인 후보와 같은 인물/관계의 목소리로 유지하세요. 실제로 상대에게 말하듯 연기하세요. 한국어 억양은 자연스럽게, 호흡은 짧게, 감정은 과하지 않게 유지하세요.
```

## 운영 원칙

1. EP001 전체 TTS 제작 전, 이 조합으로 20~30초 동일성 테스트를 수행한다.
2. 같은 문장이 아니어도 딸/아버지 나이와 관계가 유지되어야 한다.
3. 모델명, voiceName, 역할 프롬프트를 임의 변경하지 않는다.
4. EP002 이후에도 같은 조합을 기본값으로 사용하되, 매 에피소드 첫 샘플을 기존 승인 샘플과 비교한다.
5. Gemini 모델 업데이트로 음색이 흔들리면 즉시 Voice Library 버전을 올리고 재승인한다.

## 샘플 기록

### 1차 선택 조합 샘플

- 파일: `voice-tests/gemini-selected-zephyr-charon-v1/today_ai_bite_voice_selected_zephyr_charon_sample_v1.mp3`
- 길이: 약 34초
- 용도: 대표님 지정 조합 1차 샘플

### 동일성 테스트 샘플

- 파일: `voice-tests/gemini-zephyr-charon-consistency-v1/today_ai_bite_zephyr_charon_consistency_test_v1.mp3`
- 길이: 약 34초
- 용도: 같은 모델/voiceName/역할 프롬프트로 다른 문장을 말해도 딸·아버지 관계감과 음색이 유지되는지 확인

## 최종 확정 조건

대표님이 1차 선택 조합 샘플과 동일성 테스트 샘플을 모두 듣고 “이 조합으로 확정”이라고 승인하면 `Voice Library v1`로 확정한다.


---

## 최종 확정 상태

- 상태: **v1 확정**
- 제공자: Gemini TTS
- 모델: `gemini-3.1-flash-tts-preview`
- 딸 voiceName: `Zephyr`
- 아빠 voiceName: `Charon`
- 운영 방식: Gemini는 저장형 커스텀 보이스 ID가 아니므로 `model + voiceName + 역할별 프롬프트 + 대본 구조 + 에피소드별 QA`를 고정해 일관성을 관리합니다.
- EP001 리뷰본: `EP001_ZEPHYR_CHARON_REVIEW_V1.mp4` 생성 완료
- 확정 기준: 동일성 테스트 후 이 조합으로 진행 지시를 받았으므로 EP001 리뷰 제작 기준으로 확정 기록합니다.
