MarkTechPost • 104일 전

구글 AI, 표현력과 제어력을 강화한 'Gemini 3.1 Flash TTS' 공개

IMP

7/10

핵심 요약

구글이 음성 품질과 표현력 제어, 다국어 생성 기능을 집중적으로 개선한 프리뷰 텍스트 음성 변환(TTS) 모델인 Gemini 3.1 Flash TTS를 공개했습니다. 이번 릴리스는 자연어 오디오 태그, 70개 이상의 언어 기본 지원 및 다중 화자 대화를 특징으로 합니다. 이는 단순한 텍스트 변환을 넘어, 기존의 '블랙박스' 음성 생성 방식에서 탈피해 더욱 정교하게 제어 가능한 AI 음성 생성으로의 전환을 알리는 중요한 의미를 지닙니다.

번역된 본문

구글은 음성 품질, 표현력 제어, 다국어 생성 기능 향상에 초점을 맞춘 프리뷰 텍스트 음성 변환(TTS, Text-to-Speech) 모델인 Gemini 3.1 Flash TTS를 선보였습니다. 단순한 텍스트 변환에만 집중했던 이전 버전들과 달리, 이번 릴리스는 자연어 오디오 태그, 70개 이상의 언어에 대한 기본 지원, 그리고 기본 다중 화자 대화(Native multi-speaker dialogue) 기능을 핵심적으로 강조합니다. 이번 릴리스는 '블랙박스' 음성 생성 방식에서 탈피하여 […] 구글 AI, 표현력과 제어력을 갖춘 AI 음성의 새로운 벤치마크인 Gemini 3.1 Flash TTS 출시 글은 MarkTechPost에 처음 게재되었습니다.

원문 보기

원문 보기 (영어)

Google has introduced Gemini 3.1 Flash TTS, a preview text-to-speech model focused on improving speech quality, expressive control, and multilingual generation. Unlike previous iterations that prioritized simple conversion, this release emphasizes natural-language audio tags, native support for more than 70 languages, and native multi-speaker dialogue. This release signals a shift from ‘black-box’ audio generation toward […] The post Google AI Launches Gemini 3.1 Flash TTS: A New Benchmark in Expressive and Controllable AI Voice appeared first on MarkTechPost.

인공지능 음성 합성 텍스트 음성 변환 구글 다국어 지원