제미나이 옴니와 3.5 플래시 데모 11선
구글 I/O 2026에서 발표된 영상 생성·편집 모델 '제미나이 옴니(Gemini Omni)'와 복잡한 에이전트 워크플로우 실행에 최적화된 '제미나이 3.5 플래시(Gemini 3.5 Flash)'의 실제 활용 데모가 공개되었습니다. 옴니는 텍스트, 이미지, 오디오, 비디오를 혼합해 고품질 영상을 생성하고 자연어로 세밀하게 편집할 수 있게 해주며, 3.5 플래시는 '안티그래비티(Antigravity)' 하네스와 결합해 대규모의 복잡한 코딩 및 멀티모달 UI 생성 작업을 빠르고 안정적으로 수행합니다. 이번 데모들은 생성형 AI가 단순 생성을 넘어 복잡한 현실의 작업을 자율적으로 수행하고 정교하게 제어할 수 있는 수준에 도달했음을 보여줍니다.
제미나이 옴니와 제미나이 3.5(Gemini 3.5)의 실제 작동 모습을 보여주는 11가지 데모 2026년 5월 29일
제미나이 옴니(Gemini Omni)에서는 제미나이의 추론 능력과 창작 능력이 결합되었으며, 제미나이 3.5는 복잡한 에이전트 워크플로우를 실행하도록 설계되었습니다.
작성자: 자라 톰슨 (Zahra Thompson), The Keyword
본 콘텐츠는 구글 AI에 의해 생성되었으며, 생성형 AI는 실험 단계입니다.
구글 I/O 2026에서 우리는 최신 모델인 제미나이 옴니와 제미나이 3.5 모델 패밀리를 발표했습니다. 제미나이 옴니는 비디오를 시작으로 모든 입력값을 통해 어떤 것이든 생성할 수 있는 새로운 모델입니다. 옴니를 사용하면 이미지, 오디오, 비디오, 텍스트를 입력으로 결합하여 제미나이의 실제 세계 지식에 기반한 고품질 비디오를 생성할 수 있습니다. 또한 대화를 통해 비디오를 쉽게 편집할 수 있습니다.
그리고 프론티어급 지능과 행동 능력을 결합한 최신 모델 패밀리인 제미나이 3.5가 있습니다. 이는 더 유능하고 지능적인 에이전트를 구축하는 데 있어 중요한 도약을 의미합니다. 우리는 3.5 플래시(3.5 Flash)의 출시를 통해 이 시리즈를 시작합니다. 이 모델은 에이전트 및 코딩 분야에서 프론티어급 성능을 제공하며, 실용적인 가치를 창출하는 복잡한 장기 실행(Long-horizon) 작업에 탁월합니다.
제미나이 옴니와 제미나이 3.5 플래시에 대해 더 명확히 이해할 수 있도록, 이 모델들이 어떤 도움을 줄 수 있는지 보여주는 11가지 데모를 소개합니다.
제미나이 옴니(Gemini Omni)
대화를 통해 비디오 편집하기 옴니를 특별하게 만드는 기능 중 하나는 자연어를 통해 비디오를 더 쉽게 편집할 수 있다는 것입니다. 모든 지시는 이전 단계를 기반으로 작동합니다. 캐릭터의 일관성이 유지되고, 물리 법칙이 적용되며, 장면은 이전 상황을 기억합니다. 즉, 여러분이 주변 세계를 변형시킬 수 있다는 뜻입니다. 특정 사물을 변경하거나 모든 것을 바꿀 수 있습니다. 여러분의 비디오는 직접 촬영할 수 없었던 무언가를 만들기 위한 출발점이 됩니다.
- 프롬프트: 조각상을 비눗방울로 만들어줘.
액션 재구상하기 여러분이 촬영한 비디오를 가져와서 옴니에게 상황을 바꿔달라고 요청하기만 하면 됩니다. 액션을 편집하고, 새로운 캐릭터나 사물을 추가하거나, 순간을 예상치 못한 무언가로 변환할 수 있습니다.
- 프롬프트: 방의 조명을 어둡게 해줘. 손 위에 떠 있는 유리 구체 안에 흑백 체스판 무늬 방을 넣어줘. 그 안에는 구체를 들고 있는 동일한 손의 재귀적 표현이 포함되어 있으며, 방들이 무한히 반복(재귀)되도록 만들어줘. 카메라가 천천히 구체 쪽으로 다가가며 비디오 루프를 생성해줘.
여러 차례의 대화를 걸쳐 비디오 다듬기 원래 장면의 맥락을 잃지 않으면서 환경, 앵글, 스타일 또는 특정 세부 사항까지 변경할 수 있습니다. 캐러셀을 스크롤하여 편집 내용이 어떻게 서로 쌓여가는지 확인해 보세요.
- 프롬프트: 바이올리니스트가 곡을 연주하는 비디오.
- 프롬프트: 바이올리니스트를 이미지 속 환경으로 이동시켜줘.
- 프롬프트: 바이올린을 투명하게 만들어줘.
- 프롬프트: 카메라 앵글을 바이올리니스트의 어깨 위쪽으로 변경해줘.
제미나이 3.5 플래시(Gemini 3.5 Flash)
대규모 에이전트 작업 수행 3.5 플래시는 플래시 시리즈에서 기대할 수 있는 속도로 여러 차원에서 대형 플래그십 모델과 맞먹는 수준의 지능을 제공합니다. 이러한 속도와 성능의 균형 덕분에 3.5 플래시는 장기 실행 에이전트 작업을 처리하는 데 이상적입니다. 여기서 안티그래비티(Antigravity) 기반의 3.5 플래시는 동적 기준에 따라 구조화되지 않은 자산의 이름을 자동으로 바꾸고 분류하는 등 다단계 워크플로우를 실행합니다.
안티그래비티 기반의 3.5 플래시 업데이트된 안티그래비티 하네스와 결합될 때, 3.5 플래시는 가장 까다로운 사용 사례에 대해 대규모 문제를 해결하기 위해 협업하는 하위 에이전트(Sub-agents)를 배포하는 강력한 엔진이 됩니다. 감독 하에 프론티어급 성능을 유지하면서 다단계 워크플로우 및 코딩 작업을 안정적으로 실행할 수 있습니다.
3.5 플래시로 더 풍부하고 인터랙티브한 웹 UI 및 그래픽 생성 3.5 플래시는 제미나이 3(Gemini 3)의 강력한 멀티모달 기반을 바탕으로 구축되었습니다. 여기서 안티그래비티 기반의 3.5 플래시는 하위 에이전트를 사용하여 수학적 개념인 파이(Pi)의 아름다운 시각화를 만들어냅니다.