OA
r/OpenAI • 23일 전
IMP 9
실시간 음성 앱 혁신, 세 가지 오디오 API 공개
사람이 말하는 동시에 추론, 번역, 전사가 가능한 차세대 실시간 음성 모델 3종이 API를 통해 공개되었습니다. 개발자들은 이 모델을 활용하여 단순한 대화를 넘어 실시간으로 작업을 수행하고 도구를 활용하는 지능형 음성 인터페이스를 구축할 수 있게 되었습니다.
음성 AI API 실시간 번역
사람이 말하는 동시에 추론, 번역, 전사가 가능한 차세대 실시간 음성 모델 3종이 API를 통해 공개되었습니다. 개발자들은 이 모델을 활용하여 단순한 대화를 넘어 실시간으로 작업을 수행하고 도구를 활용하는 지능형 음성 인터페이스를 구축할 수 있게 되었습니다.
텍스트 번역 기업 DeepL이 회의, 모바일 대화, 현장 근무자용 그룹 대화 등 다양한 환경을 지원하는 실시간 음성 대 음성(Voice-to-Voice) 번역 제품군과 API를 공식 출시했습니다. 줌(Zoom)과 마이크로소프트 팀즈(Teams) 플러그인 연동, 산업별 맞춤형 어휘 학습 기능을 제공하여 글로벌 비즈니스 및 고객 지원 환경에서 즉각적인 활용이 가능합니다. 이번 출시로 DeepL은 기존 텍스트 번역 역량을 바탕으로 음성 AI 시장의 유력한 경쟁자로 자리매김하며, 향후 텍스트 변환 과정을 생략하는 엔드투엔드(End-to-End) 음성 번역 모델 개발도 예고했습니다.