메뉴

#구글 (Google)

TD
The Decoder 45일 전
IMP 7

구글, 70개 이상 언어를 지원하는 가장 표현력 뛰어난 Gemini 3.1 TTS 공개

구글이 텍스트를 자연스러운 음성으로 변환해주는 'Gemini 3.1 Flash TTS' 모델을 공개했습니다. 이 모델은 70개 이상의 언어를 지원하며, 스타일과 속도, 톤을 세밀하게 조정할 수 있는 새로운 오디오 태그 기능을 제공합니다. 이를 통해 개발자들은 전 세계 다양한 언어권에서 사용자 경험을 크게 향상시키는 고품질 음성 서비스를 구축할 수 있습니다.

음성 생성 (TTS) 구글 (Google) Gemini 3.1
TC
TechCrunch AI 54일 전
IMP 7

구글, 오프라인 구동되는 AI 받아쓰기 앱 출시

구글이 Wispr Flow, SuperWhisper 등과 경쟁하기 위해 오프라인에서도 AI 받아쓰기가 가능한 'Google AI Edge Eloquent' 앱을 iOS용으로 조용히 출시했습니다. 이 앱은 온디바이스 기반의 Gemma 모델을 사용하여 음성을 텍스트로 변환하고, 불필요한 추임새를 자동으로 제거하여 깔끔한 문장으로 다듬어주는 것이 특징입니다. 현재는 iOS 버전만 제공되지만 향후 안드로이드 통합 기능도 지원될 예정이며, 이번 실험적 출시를 통해 구글의 본격적인 음성 AI 시장 진출을 확인할 수 있습니다.

음성 인식 (ASR) 온디바이스 AI 구글 (Google)