🗣️ 기본 TTS 구현 프롬프트
가장 기본적인 TTS 기능을 위한 뼈대 프롬프트입니다. 이 프롬프트는 텍스트를 입력받아 음성으로 변환하는 핵심 로직을 구현하는 데 집중합니다.
"당신은 텍스트 음성 변환(Text-to-Speech, TTS) 시스템을 구축하는 엔지니어입니다. 사용자로부터 입력받은 텍스트를 처리하여 **자연스러운 음성 파일(예: WAV, MP3)**로 출력하는 기능을 구현하는 코드를 작성해주세요. 음성 합성에 필요한 **핵심 라이브러리(예: gTTS, Coqui TTS, 또는 클라우드 API)**를 명시하고, 기본적인 사용 예시를 제공해야 합니다."
🔧 점진적으로 추가할 수 있는 메뉴 아이디어
기본 뼈대가 완성된 후, 다음 단계로 음성 품질과 표현력을 높이는 다양한 제어 메뉴들을 점진적으로 추가해 보세요.
1. 🎤 음성 선택 및 기본 속성 제어
가장 먼저 추가하여 TTS의 개성을 부여하는 메뉴들입니다.
| 메뉴 항목 | 기능 설명 |
| 화자(Speaker) 선택 | 남성, 여성, 어린이 등 다양한 화자 모델을 선택할 수 있게 합니다. (예: '표준 여성', '활기찬 남성', '뉴스 앵커') |
| 언어(Language) 선택 | 한국어 외에 영어, 일본어 등 다른 언어로 변환할 수 있게 합니다. |
| 속도(Rate/Speed) 조절 | 음성의 재생 속도를 빠르게 또는 느리게 조절하는 슬라이더 또는 옵션 (예: 0.5배속, 1.0배속, 1.5배속)을 추가합니다. |
| 음높이(Pitch) 조절 | 음성의 톤을 높거나 낮게 조절하는 옵션을 추가합니다. |
2. 🎶 발음 및 감정 표현 고급 제어
더욱 자연스럽고 표현력 있는 음성을 만들기 위해 추가하는 메뉴입니다.
| 메뉴 항목 | 기능 설명 |
| 감정(Emotion) 선택 | 행복, 슬픔, 분노, 차분함 등 특정 감정을 입혀서 읽어주도록 합니다. |
| 강세(Emphasis) 조절 | 텍스트의 특정 단어나 구절에 강조를 넣어 읽도록 제어합니다 (SSML 태그 사용). |
| 휴지(Pause) 조절 | 문장 부호 외에 특정 위치에 임의의 길이의 공백(Pause)을 삽입하여 호흡을 조절합니다 (SSML 태그 사용). |
| 발음 수정(Pronunciation) | 특정 단어의 발음이 정확하지 않을 때 (예: 외래어, 전문 용어) 이를 교정 발음으로 대체하도록 지정합니다. |
3. 💾 출력 및 환경 설정
사용 편의성을 높이기 위한 메뉴들입니다.
| 메뉴 항목 | 기능 설명 |
| 출력 파일 형식 | 음성 파일의 형식을 WAV, MP3, OGG 등으로 선택할 수 있게 합니다. |
| 볼륨 조절 | 출력되는 음성 파일의 전체 볼륨을 조절합니다. |
| API 키 설정 | 클라우드 TTS 서비스(Google, Azure, Naver 등)를 사용할 경우 API 키를 설정하는 메뉴를 추가합니다. |
💡 확장 프롬프트 예시 (속도 조절 메뉴 추가)
기본 프롬프트에 속도 조절 기능을 추가하는 방식으로 확장할 수 있습니다.
"이전 [기본 TTS 프롬프트]에서 구현한 TTS 시스템에 음성 속도 조절 기능을 추가합니다. 사용자가 입력 텍스트와 함께 **속도 배율(Rate Multiplier)**을 지정할 수 있도록 기능을 확장해주세요. 속도 배율은 0.5 (느리게)에서 2.0 (빠르게) 사이의 값으로 설정 가능해야 합니다. 이 속도 파라미터를 적용하여 음성 파일을 출력하는 코드를 작성하세요."