메뉴
BL
The Decoder 28일 전

엑스AI 커스텀 보이스: 1분 녹음으로 목소리 복제

IMP
7/10
핵심 요약

엑스AI(xAI)가 약 1분 분량의 짧은 음성 녹음만으로 자신의 목소리를 복제할 수 있는 '커스텀 보이스(Custom Voices)' 기능을 출시했습니다. 실시간 인증과 음성 특징 비교를 통한 2단계 검증을 통해 타인의 목소리나 기존 녹음본의 무단 복제를 원천 차단하여 오용을 방지하는 것이 특징입니다. 이 기능은 기존에 공개된 음성-텍스트/텍스트-음성 변환 API 및 스타링크(Starlink) 고객 지원에 적용된 음성 에이전트 모델과 연동되어 추가 요금 없이 사용할 수 있어 개발자와 실무자들에게 유용한 도구로 평가받습니다.

번역된 본문

엑스AI(xAI)의 새로운 '커스텀 보이스(Custom Voices)' 기능, 단 1분의 음성으로 목소리 복제 가능

마티아스 바스티안(Matthias Bastian) | 2026년 5월 2일

엑스AI(xAI)가 사용자가 짧은 녹음만으로 자신의 목소리를 복제할 수 있는 '커스텀 보이스(Custom Voices)'라는 새로운 기능을 출시했습니다. 엑스AI 콘솔을 통해 캡처된 약 1분 분량의 자연스러운 음성만 있으면 됩니다.

엑스AI에 따르면, 음성 모델은 2분 이내에 준비되며 회사의 텍스트 음성 변환(TTS) 및 음성 에이전트 API에 연동하여 즉시 사용할 수 있습니다.

오용을 방지하기 위해 엑스AI는 2단계 검증 프로세스를 사용합니다. 사용자가 먼저 실시간으로 확인되는 암호 문구를 읽으면, 시스템은 두 녹음의 음성 특징을 비교하여 동일한 사람이 말하고 있는지 최종 확인합니다. 엑스AI는 이 설정을 통해 기존 녹음본이나 다른 사람의 목소리를 복제하는 것이 불가능하다고 밝혔습니다.

또한 엑스AI 콘솔에는 28개 언어에 걸쳐 80개 이상의 사전 설치된 음성이 포함된 새로운 '음성 라이브러리(Voice Library)'가 추가되었습니다. 복제된 음성을 사용해도 추가 비용은 발생하지 않습니다.

'커스텀 보이스'는 최근 출시된 엑스AI의 그록(Grok) 음성-텍스트 변환(STT) 및 텍스트-음성 변환(TTS) API와 'Grok Voice Think Fast 1.0' 음성 에이전트 모델을 기반으로 구축되었습니다. 엑스AI는 해당 음성 에이전트 모델이 이미 스타링크(Starlink)의 고객 지원 및 영업 시스템에 사용되고 있다고 덧붙였습니다.

원문 보기
원문 보기 (영어)
xAI's new Custom Voices feature turns a minute of speech into a usable voice clone Matthias Bastian View the LinkedIn Profile of Matthias Bastian May 2, 2026 xAI has launched a new feature called "Custom Voices" that lets users clone their own voice with just a short recording. All it takes is about a minute of natural speech captured through the xAI console. xAI says the voice model is ready in under two minutes and can be plugged into the company's text-to-speech and voice agent APIs. To prevent misuse, xAI uses a two-step verification process. Users first read a passphrase that's checked in real time, and the system then compares the voice characteristics of both recordings to confirm the same person is speaking. According to xAI, the setup makes it impossible to clone existing recordings or someone else's voice. The xAI console also gets a new "Voice Library" with more than 80 preinstalled voices across 28 languages. Using cloned voices doesn't cost extra. Ad "Custom Voices" builds on xAI's recently launched Grok Speech-to-Text and Text-to-Speech APIs and the "Grok Voice Think Fast 1.0" voice agent model, which xAI says already powers Starlink's customer support and sales. Ad DEC_D_Incontent-1 AI News Without the Hype – Curated by Humans Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section. Subscribe now Source: xAI Ask about this article… Search