# Gemini TTS 일관성/품질 운영 계획 — 오늘의 AI 한입

작성일: 2026-05-03
상태: Gemini TTS가 현재까지 테스트한 후보 중 가장 양호하나, 장기 일관성과 추가 품질 개선 필요.

## 1. 현재 판단

대표님 평가:

- Gemini TTS 후보가 지금까지 만든 샘플보다 약 10배 낫다.
- 다만 장기적으로 같은 딸/아버지 목소리를 일관되게 유지할 수 있을지 의문이 있다.
- 아직 품질 향상이 더 필요하다.

실장 판단:

- 현재 전체 영상 제작을 재개하기에는 이르다.
- Gemini TTS를 우선 후보로 두되, **Voice Library 수준의 운영 규칙**을 만들어야 한다.
- 딸/아빠 목소리를 `voiceName`, 프롬프트, 말투, 속도, 문장 길이, 샘플 QA로 고정해야 한다.

## 2. Gemini TTS 일관성 유지 원칙

Gemini TTS는 ElevenLabs의 특정 저장 보이스/클론처럼 “사용자 정의 음색 ID”가 있는 구조라기보다, 모델 + prebuilt voiceName + 프롬프트 + 텍스트 맥락에 의해 음성이 결정된다.

따라서 일관성은 아래 요소를 고정해서 관리한다.

1. 모델 고정
   - 현재 성공 모델: `gemini-3.1-flash-tts-preview`
   - 모델 변경 시 반드시 기존 승인 샘플과 비교 QA

2. 보이스 이름 고정
   - 후보 1: 딸 `Kore`, 아빠 `Orus`
   - 후보 2: 딸 `Leda`, 아빠 `Charon`
   - 최종 선택 후 EP001부터 채널 Voice Library에 기록

3. 역할별 스타일 프롬프트 고정
   - 딸: 젊은 성인 딸, 밝고 따뜻함, 아빠에게 쉽게 설명, 강사/뉴스앵커 금지
   - 아빠: 50~60대 한국 아버지, 편안하고 궁금함, 기업 내레이터 금지

4. 대본 구조 고정
   - 한 줄은 1호흡 이내
   - 딸은 설명 전 생활 예시를 먼저 말함
   - 아버지는 짧게 묻고 자기 말로 다시 정리
   - 어려운 기관명/영문 약어는 뒤쪽에 짧게만 사용

5. 샘플 검수 후 전체 제작
   - 에피소드마다 전체 TTS 전 20~30초 샘플 생성
   - 승인된 보이스와 비교해 나이/관계감/억양이 유지되는지 확인

## 3. 품질 개선 방향

### 3.1 프롬프트 개선

기존 프롬프트는 역할 설명은 했지만, 한국 가족 대화 리듬이 충분히 세밀하지 않았다.

개선 프롬프트에는 다음을 추가한다.

- “대본을 읽는 느낌이 아니라 실제 대화처럼”
- “문장 끝을 너무 딱딱하게 끊지 말 것”
- “아버지는 딸에게 편하게 묻는 말투”
- “딸은 아빠를 가르치지 않고 부드럽게 설명”
- “뉴스 앵커/강사/상담원 톤 금지”
- “한국어 자연 대화의 속도와 억양”

### 3.2 대본 개선

TTS 품질은 대본의 말하기 쉬움에 크게 좌우된다.

- 한 문장 20~35자 중심
- 복합문 줄이기
- 어려운 말은 아버지 질문으로 풀기
- `취약점`, `CVE`, `CISA`는 공식 자료 컷에서만 최소 사용
- 대화체 예: “그냥 나중에 눌러도 되는 줄 알았지.”

### 3.3 후보 비교

다음 후보를 추가 비교한다.

- Gemini 후보 1 개선판: 딸 `Kore`, 아빠 `Orus`
- Gemini 후보 2 개선판: 딸 `Leda`, 아빠 `Charon`
- Gemini 후보 3 가능 시: 다른 voiceName 조합
- Supertone 가능 시: 한국어 특화 후보 1~2개
- CLOVA 가능 시: 웹 기반 후보 1개

## 4. 승인 전 금지

- Gemini TTS가 이전보다 낫다는 이유만으로 전체 영상 제작 금지
- 목소리 일관성 계획 없이 EP002 이후까지 운영 금지
- 매번 프롬프트를 새로 쓰며 음색이 흔들리는 방식 금지
- 승인 샘플 없이 긴 TTS 생성 금지

## 5. 다음 작업

1. Gemini TTS 개선 프롬프트로 후보 1/2를 다시 생성한다.
2. 자료실에 기존 후보와 개선 후보를 함께 올린다.
3. 대표님이 최종 보이스 조합을 선택한다.
4. 선택된 조합을 `VOICE_LIBRARY_TODAY_AI_BITE.md`에 고정한다.
5. 그 뒤 EP001 전체 대본/TTS/영상 재제작으로 넘어간다.
