메뉴
BL
Wired AI 11일 전

구글, 본인 딥페이크를 쉽게 만드는 신기능 공개

IMP
8/10
핵심 요약

구글이 연례 개발자 회의인 I/O에서 AI 영상 및 이미지 생성 툴인 'Flow'에 자신의 외형을 그대로 구현한 '아바타(Avatar)' 기능을 추가했습니다. 새롭게 탑재된 'Omni Flash' 모델을 통해 사용자는 별도의 촬영 없이도 자신과 똑같이 생긴 AI 딥페이크를 영상 속에 자연스럽게 등장시킬 수 있습니다. 이는 차세대 콘텐츠 크리에이터를 위한 도구를 넘어, 자연어 기반의 에이전트 및 '바이브 코딩(Vibe Coding)'을 대중화하려는 구글의 포괄적인 AI 전략의 일환입니다.

번역된 본문

Google Labs의 제품 관리 부사장인 엘리아스 로만(Elias Roman)이 사용자가 AI로 영상과 이미지를 생성하고 리믹스할 수 있는 구글의 도구인 'Flow'의 새로운 '아바타' 기능을 시연하는 동안, 나는 이미 한번 겪어본 듯한 강렬한 데자뷰를 느꼈다. 그는 이전에 자신의 외모를 스캔하여 디지털 복제본을 만든 바 있다. 이제 그는 구글의 새로운 Omni Flash 모델을 사용하여 원하는 모든 AI 생성 영상 클립에 자신을 삽입할 수 있다. 로만은 "이 기능은 스스로를 콘텐츠에 담고 싶지만 직접 촬영하는 번거로움은 피하고 싶은 크리에이터들을 위해 만들어졌다"고 말한다.

이러한 소셜 미디어 우선, 셀카형 딥페이크 스타일은 현재 폐지된 OpenAI의 Sora 앱에서 볼 수 있었던 전형적인 기능을 떠올리게 한다. 구글은 카메오나 캐릭터 대신 이들을 '아바타'라고 부른다. 이 아바타 기능은 Gemini 앱과 YouTube를 통해서도 사용할 수 있다. 구글은 캘리포니아 마운틴뷰에서 열린 연례 I/O 개발자 회의에서 이 새로운 기능을 발표했다.

구글은 작년에 실험적인 Labs 부서를 통해 Flow를 출시했다. 로만은 "구글은 이전에 크리에이티브 작업을 위한 제품 라인을 가져본 적이 없다"며, "생산성 분야나 개발자, 영상 소비 측면에서는 확실히 제품이 있었지만 크리에이티브 작업을 위한 제품은 없었다"고 말했다. 그는 이를 구글이 차세대 크리에이터를 위한 도구를 구축하려는 시도로 보고 있다.

Google Search를 둘러싼 I/O의 다른 발표들과 마찬가지로, Flow의 많은 새로운 변화는 본질적으로 자동화된 소프트웨어 작업 지시자인 'AI 에이전트(AI agents)'와 자연어 프롬프트를 통해 맞춤형 기능을 구축하는 '바이브 코딩(vibe coding)'을 더 넓은 대중에게 메인스트림으로 만들려는 구글의 더 큰 노력의 일환이다. 예를 들어, 사용자는 영상을 생성할 때 맞춤형 명령을 반복할 수 있으며, 유사한 스타일의 클립을 폴더로 자동 분류하는 워크플로우를 만들 수 있다.

Flow에서 가장 즉각적으로 눈에 띄는 변화 중 하나는 이 경험을 구동하는 새로운 영상 생성 모델인 Veo의 후속작, 'Omni Flash'이다. 구글의 Nano Banana 모델이 AI 이미지 생성 과정에 세계에 대한 더 많은 맥락을 가져온 것과 유사하게, Omni Flash 모델은 클립 전체에 걸쳐 더 풍부한 디테일로 영상 생성 과정을 전면적으로 개선했다. Flow 사용자는 Omni Flash 모델을 통해 AI 영상 내 캐릭터를 훨씬 더 일관성 있게 생성할 수 있다. 로만은 이것이 과거 버전의 Flow에서 생성된 캐릭터가 연속적인 영상 생성 과정에서 일그러질 수 있었던 약점을 크게 개선한 것이라고 말한다.

또한, Flow 사용자가 이제 AI 장면 속에 핵심 캐릭터로 생성할 수 있는 대상은 바로 '자기 자신'이다. 사용자는 Flow 계정 설정에 들어가 휴대폰으로 QR 코드를 스캔하여 자신의 '아바타'를 설정한다. 그러면 구글은 사용자에게 일련의 숫자를 크게 말하고 머리를 움직여 모든 각도를 캡처하도록 요청한다. 이 셀카 캡처 방식은 작년에 AI 기반 소셜 미디어 플랫폼으로 출시되어 사람들이 자신의 클립을 생성하고 공유할 수 있었던 Sora 앱에 가입한 사람들에게 매우 익숙할 것이다. 그러나 OpenAI는 출시 7개월도 채 되지 않아 이 앱을 놀랍게도 폐지했다.

사용자가 설정에 따라 다른 사용자의 영상을 생성할 수 있었던 Sora 앱과 달리, 구글의 아바타에 대한 초기 초점은 사용자가 자신의 AI 버전만 생성할 수 있도록 한다는 점이며, 다른 사람의 버전은 생성할 수 없다. 아바타가 포함된 Omni 모델로 생성된 모든 영상에는 구글의 SynthID 워터마크가 포함된다.

로만은 "여러 각도에서 목소리와 시각적 정체성을 캡처하여 꽤 높은 수준의 디테일로 이를 영상에 나타나게 할 수 있다"고 말했다. 그는 자신이 쓰레기 불더미 앞에서 Flow 팀을 디스하는 반어적인 영상을 생성했는데, AI로 만들어진 자신의 모습은 생생하게 살아 움직였고 목소리도 진짜와 같았다. 그런 다음 그는 Flow를 사용하여 새로운 배경 설정이나 다른 색상의 셔츠와 같이 생성물에 대한 변경을 요청했고, Omni Flash는 아바타의 디테일을 보존하면서 클립을 성공적으로 수정했다. 이것이 구글이 크리에이터를 위해 자기 통제형 딥페이크 영상 도구의 버전을 선보인 것은 이번이 처음이 아니다. 지난달에는 YouTube Shorts에도 관련 기능이 추가되었다.

원문 보기
원문 보기 (영어)
Comment Loader Save Story Save this story Comment Loader Save Story Save this story A wave of déjà vu washes over me as Elias Roman, vice president of product management at Google Labs, demos a new “avatar” feature for Flow, the company’s tool that lets users generate and remix AI videos and images. He previously scanned his likeness to create a digital clone of himself. Now, he can insert himself into any AI-generated videoclip he wants using Google’s new Omni Flash model. “This is for creators who want to bring themselves into their content but don't want to have to shoot themselves,” Roman says. This specific style of social-first, selfie deepfake is reminiscent of a quintessential feature from OpenAI’s now-defunct Sora app —rather than cameos or characters, Google calls them avatars. These avatars are also available through the Gemini app and YouTube . Google announced the new feature at its annual I/O developer conference in Mountain View, California. Google launched Flow last year under its experimental Labs division. “Google has never had a product line for creative work before,” Roman says. “Productivity, definitely. Developers, absolutely. Video consumption, yes. Not for creative work.” He sees this as Google’s attempt to build tools for the next generation of creators. Similar to other announcements from Google I/O surrounding Google Search, many of the new changes to Flow are part of the company’s larger attempt to make AI agents , essentially automated software taskmasters, and vibe coding , building bespoke features with natural language prompts to AI, more mainstream for a broader audience. For example, users can repeat custom instructions when generating videos and create automated workflows that sort similarly styled clips into folders. One of the most immediately noticeable changes to Flow is the new video-generation model powering the experience: Omni Flash, succeeding Veo . Similar to how Google’s Nano Banana model brought more context about the world into the AI image-creation process, the Omni Flash model overhauls video generation with richer detail throughout clips. Flow users can generate characters in AI videos with more consistency via the Omni Flash model. Roman says this is a major improvement over the weakness in past versions of Flow, where created characters could warp during successive video generations. Also, a key character that Flow users can now generate in an AI scene after an AI scene? Themselves. Users set up an “avatar” of themselves by going into the settings of their Flow account and scanning a QR code on their phone. Then, Google asks users to record themselves saying a string of numbers aloud and move their head around to capture every angle. This selfie-capture style will feel familiar to anyone who signed up for the Sora app, which OpenAI launched last year as an AI-first social media platform where people can generate and share clips of themselves. OpenAI startlingly wound it down after less than seven months. Unlike the Sora app, where users could generate videos of other users depending on the person’s settings, Google’s initial focus with its avatars is to let users create AI versions of themselves only, not other people. Every video generated with the Omni model, including those with your avatar, includes Google’s SynthID watermark . “You can capture your voice and your visual identity from multiple angles and have that show up with pretty high levels of fidelity,” Roman says. He generated a tongue-in-cheek video of himself roasting the Flow team in front of a dumpster fire, with an AI version of himself that looked lifelike and sounded like him. Then he used Flow to request changes to the generation, like a new background setting and a different-colored shirt, and Omni Flash adjusted the clips while preserving the avatar’s details. This isn’t the first time Google has rolled out a version of self-controlled deepfake video tools for creators—last month, YouTube Shorts added a limited option for users to make similar AI avatars that can be inserted into clips on that platform. Other Silicon Valley companies are also looking for ways to transform creators’ outputs using generative AI. For example, last year, Meta rolled out an AI feature that can seamlessly translate Instagram Reels into different languages, even adjusting creators’ lips to match the different voices. While these AI tools may streamline aspects of the content production pipeline for creators—you don’t even have to get out of bed now to generate sassy vertical videos—generative AI is increasingly polarizing audiences who see these videos as inauthentic or not aligned with their values. Well, that’s if they actually clock the videos as AI.