구글, 본인 딥페이크를 쉽게 만드는 신기능 공개
구글이 연례 개발자 회의인 I/O에서 AI 영상 및 이미지 생성 툴인 'Flow'에 자신의 외형을 그대로 구현한 '아바타(Avatar)' 기능을 추가했습니다. 새롭게 탑재된 'Omni Flash' 모델을 통해 사용자는 별도의 촬영 없이도 자신과 똑같이 생긴 AI 딥페이크를 영상 속에 자연스럽게 등장시킬 수 있습니다. 이는 차세대 콘텐츠 크리에이터를 위한 도구를 넘어, 자연어 기반의 에이전트 및 '바이브 코딩(Vibe Coding)'을 대중화하려는 구글의 포괄적인 AI 전략의 일환입니다.
Google Labs의 제품 관리 부사장인 엘리아스 로만(Elias Roman)이 사용자가 AI로 영상과 이미지를 생성하고 리믹스할 수 있는 구글의 도구인 'Flow'의 새로운 '아바타' 기능을 시연하는 동안, 나는 이미 한번 겪어본 듯한 강렬한 데자뷰를 느꼈다. 그는 이전에 자신의 외모를 스캔하여 디지털 복제본을 만든 바 있다. 이제 그는 구글의 새로운 Omni Flash 모델을 사용하여 원하는 모든 AI 생성 영상 클립에 자신을 삽입할 수 있다. 로만은 "이 기능은 스스로를 콘텐츠에 담고 싶지만 직접 촬영하는 번거로움은 피하고 싶은 크리에이터들을 위해 만들어졌다"고 말한다.
이러한 소셜 미디어 우선, 셀카형 딥페이크 스타일은 현재 폐지된 OpenAI의 Sora 앱에서 볼 수 있었던 전형적인 기능을 떠올리게 한다. 구글은 카메오나 캐릭터 대신 이들을 '아바타'라고 부른다. 이 아바타 기능은 Gemini 앱과 YouTube를 통해서도 사용할 수 있다. 구글은 캘리포니아 마운틴뷰에서 열린 연례 I/O 개발자 회의에서 이 새로운 기능을 발표했다.
구글은 작년에 실험적인 Labs 부서를 통해 Flow를 출시했다. 로만은 "구글은 이전에 크리에이티브 작업을 위한 제품 라인을 가져본 적이 없다"며, "생산성 분야나 개발자, 영상 소비 측면에서는 확실히 제품이 있었지만 크리에이티브 작업을 위한 제품은 없었다"고 말했다. 그는 이를 구글이 차세대 크리에이터를 위한 도구를 구축하려는 시도로 보고 있다.
Google Search를 둘러싼 I/O의 다른 발표들과 마찬가지로, Flow의 많은 새로운 변화는 본질적으로 자동화된 소프트웨어 작업 지시자인 'AI 에이전트(AI agents)'와 자연어 프롬프트를 통해 맞춤형 기능을 구축하는 '바이브 코딩(vibe coding)'을 더 넓은 대중에게 메인스트림으로 만들려는 구글의 더 큰 노력의 일환이다. 예를 들어, 사용자는 영상을 생성할 때 맞춤형 명령을 반복할 수 있으며, 유사한 스타일의 클립을 폴더로 자동 분류하는 워크플로우를 만들 수 있다.
Flow에서 가장 즉각적으로 눈에 띄는 변화 중 하나는 이 경험을 구동하는 새로운 영상 생성 모델인 Veo의 후속작, 'Omni Flash'이다. 구글의 Nano Banana 모델이 AI 이미지 생성 과정에 세계에 대한 더 많은 맥락을 가져온 것과 유사하게, Omni Flash 모델은 클립 전체에 걸쳐 더 풍부한 디테일로 영상 생성 과정을 전면적으로 개선했다. Flow 사용자는 Omni Flash 모델을 통해 AI 영상 내 캐릭터를 훨씬 더 일관성 있게 생성할 수 있다. 로만은 이것이 과거 버전의 Flow에서 생성된 캐릭터가 연속적인 영상 생성 과정에서 일그러질 수 있었던 약점을 크게 개선한 것이라고 말한다.
또한, Flow 사용자가 이제 AI 장면 속에 핵심 캐릭터로 생성할 수 있는 대상은 바로 '자기 자신'이다. 사용자는 Flow 계정 설정에 들어가 휴대폰으로 QR 코드를 스캔하여 자신의 '아바타'를 설정한다. 그러면 구글은 사용자에게 일련의 숫자를 크게 말하고 머리를 움직여 모든 각도를 캡처하도록 요청한다. 이 셀카 캡처 방식은 작년에 AI 기반 소셜 미디어 플랫폼으로 출시되어 사람들이 자신의 클립을 생성하고 공유할 수 있었던 Sora 앱에 가입한 사람들에게 매우 익숙할 것이다. 그러나 OpenAI는 출시 7개월도 채 되지 않아 이 앱을 놀랍게도 폐지했다.
사용자가 설정에 따라 다른 사용자의 영상을 생성할 수 있었던 Sora 앱과 달리, 구글의 아바타에 대한 초기 초점은 사용자가 자신의 AI 버전만 생성할 수 있도록 한다는 점이며, 다른 사람의 버전은 생성할 수 없다. 아바타가 포함된 Omni 모델로 생성된 모든 영상에는 구글의 SynthID 워터마크가 포함된다.
로만은 "여러 각도에서 목소리와 시각적 정체성을 캡처하여 꽤 높은 수준의 디테일로 이를 영상에 나타나게 할 수 있다"고 말했다. 그는 자신이 쓰레기 불더미 앞에서 Flow 팀을 디스하는 반어적인 영상을 생성했는데, AI로 만들어진 자신의 모습은 생생하게 살아 움직였고 목소리도 진짜와 같았다. 그런 다음 그는 Flow를 사용하여 새로운 배경 설정이나 다른 색상의 셔츠와 같이 생성물에 대한 변경을 요청했고, Omni Flash는 아바타의 디테일을 보존하면서 클립을 성공적으로 수정했다. 이것이 구글이 크리에이터를 위해 자기 통제형 딥페이크 영상 도구의 버전을 선보인 것은 이번이 처음이 아니다. 지난달에는 YouTube Shorts에도 관련 기능이 추가되었다.