메뉴
BL
Google AI Blog 1일 전

제미나이 옴니와 3.5 플래시 데모 11선

IMP
9/10
핵심 요약

구글 I/O 2026에서 발표된 영상 생성·편집 모델 '제미나이 옴니(Gemini Omni)'와 복잡한 에이전트 워크플로우 실행에 최적화된 '제미나이 3.5 플래시(Gemini 3.5 Flash)'의 실제 활용 데모가 공개되었습니다. 옴니는 텍스트, 이미지, 오디오, 비디오를 혼합해 고품질 영상을 생성하고 자연어로 세밀하게 편집할 수 있게 해주며, 3.5 플래시는 '안티그래비티(Antigravity)' 하네스와 결합해 대규모의 복잡한 코딩 및 멀티모달 UI 생성 작업을 빠르고 안정적으로 수행합니다. 이번 데모들은 생성형 AI가 단순 생성을 넘어 복잡한 현실의 작업을 자율적으로 수행하고 정교하게 제어할 수 있는 수준에 도달했음을 보여줍니다.

번역된 본문

제미나이 옴니와 제미나이 3.5(Gemini 3.5)의 실제 작동 모습을 보여주는 11가지 데모 2026년 5월 29일

제미나이 옴니(Gemini Omni)에서는 제미나이의 추론 능력과 창작 능력이 결합되었으며, 제미나이 3.5는 복잡한 에이전트 워크플로우를 실행하도록 설계되었습니다.

작성자: 자라 톰슨 (Zahra Thompson), The Keyword

본 콘텐츠는 구글 AI에 의해 생성되었으며, 생성형 AI는 실험 단계입니다.

구글 I/O 2026에서 우리는 최신 모델인 제미나이 옴니와 제미나이 3.5 모델 패밀리를 발표했습니다. 제미나이 옴니는 비디오를 시작으로 모든 입력값을 통해 어떤 것이든 생성할 수 있는 새로운 모델입니다. 옴니를 사용하면 이미지, 오디오, 비디오, 텍스트를 입력으로 결합하여 제미나이의 실제 세계 지식에 기반한 고품질 비디오를 생성할 수 있습니다. 또한 대화를 통해 비디오를 쉽게 편집할 수 있습니다.

그리고 프론티어급 지능과 행동 능력을 결합한 최신 모델 패밀리인 제미나이 3.5가 있습니다. 이는 더 유능하고 지능적인 에이전트를 구축하는 데 있어 중요한 도약을 의미합니다. 우리는 3.5 플래시(3.5 Flash)의 출시를 통해 이 시리즈를 시작합니다. 이 모델은 에이전트 및 코딩 분야에서 프론티어급 성능을 제공하며, 실용적인 가치를 창출하는 복잡한 장기 실행(Long-horizon) 작업에 탁월합니다.

제미나이 옴니와 제미나이 3.5 플래시에 대해 더 명확히 이해할 수 있도록, 이 모델들이 어떤 도움을 줄 수 있는지 보여주는 11가지 데모를 소개합니다.

제미나이 옴니(Gemini Omni)

대화를 통해 비디오 편집하기 옴니를 특별하게 만드는 기능 중 하나는 자연어를 통해 비디오를 더 쉽게 편집할 수 있다는 것입니다. 모든 지시는 이전 단계를 기반으로 작동합니다. 캐릭터의 일관성이 유지되고, 물리 법칙이 적용되며, 장면은 이전 상황을 기억합니다. 즉, 여러분이 주변 세계를 변형시킬 수 있다는 뜻입니다. 특정 사물을 변경하거나 모든 것을 바꿀 수 있습니다. 여러분의 비디오는 직접 촬영할 수 없었던 무언가를 만들기 위한 출발점이 됩니다.

  • 프롬프트: 조각상을 비눗방울로 만들어줘.

액션 재구상하기 여러분이 촬영한 비디오를 가져와서 옴니에게 상황을 바꿔달라고 요청하기만 하면 됩니다. 액션을 편집하고, 새로운 캐릭터나 사물을 추가하거나, 순간을 예상치 못한 무언가로 변환할 수 있습니다.

  • 프롬프트: 방의 조명을 어둡게 해줘. 손 위에 떠 있는 유리 구체 안에 흑백 체스판 무늬 방을 넣어줘. 그 안에는 구체를 들고 있는 동일한 손의 재귀적 표현이 포함되어 있으며, 방들이 무한히 반복(재귀)되도록 만들어줘. 카메라가 천천히 구체 쪽으로 다가가며 비디오 루프를 생성해줘.

여러 차례의 대화를 걸쳐 비디오 다듬기 원래 장면의 맥락을 잃지 않으면서 환경, 앵글, 스타일 또는 특정 세부 사항까지 변경할 수 있습니다. 캐러셀을 스크롤하여 편집 내용이 어떻게 서로 쌓여가는지 확인해 보세요.

  • 프롬프트: 바이올리니스트가 곡을 연주하는 비디오.
  • 프롬프트: 바이올리니스트를 이미지 속 환경으로 이동시켜줘.
  • 프롬프트: 바이올린을 투명하게 만들어줘.
  • 프롬프트: 카메라 앵글을 바이올리니스트의 어깨 위쪽으로 변경해줘.

제미나이 3.5 플래시(Gemini 3.5 Flash)

대규모 에이전트 작업 수행 3.5 플래시는 플래시 시리즈에서 기대할 수 있는 속도로 여러 차원에서 대형 플래그십 모델과 맞먹는 수준의 지능을 제공합니다. 이러한 속도와 성능의 균형 덕분에 3.5 플래시는 장기 실행 에이전트 작업을 처리하는 데 이상적입니다. 여기서 안티그래비티(Antigravity) 기반의 3.5 플래시는 동적 기준에 따라 구조화되지 않은 자산의 이름을 자동으로 바꾸고 분류하는 등 다단계 워크플로우를 실행합니다.

안티그래비티 기반의 3.5 플래시 업데이트된 안티그래비티 하네스와 결합될 때, 3.5 플래시는 가장 까다로운 사용 사례에 대해 대규모 문제를 해결하기 위해 협업하는 하위 에이전트(Sub-agents)를 배포하는 강력한 엔진이 됩니다. 감독 하에 프론티어급 성능을 유지하면서 다단계 워크플로우 및 코딩 작업을 안정적으로 실행할 수 있습니다.

3.5 플래시로 더 풍부하고 인터랙티브한 웹 UI 및 그래픽 생성 3.5 플래시는 제미나이 3(Gemini 3)의 강력한 멀티모달 기반을 바탕으로 구축되었습니다. 여기서 안티그래비티 기반의 3.5 플래시는 하위 에이전트를 사용하여 수학적 개념인 파이(Pi)의 아름다운 시각화를 만들어냅니다.

원문 보기
원문 보기 (영어)
11 demos of Gemini Omni and Gemini 3.5 in action May 29, 2026 · Share x.com Facebook LinkedIn Mail Copy link With Gemini Omni, Gemini’s ability to reason meets the ability to create, while Gemini 3.5 is built to help you execute complex, agentic workflows. Zahra Thompson Contributor, The Keyword Share x.com Facebook LinkedIn Mail Copy link Your browser does not support the audio element. Listen to article This content is generated by Google AI. Generative AI is experimental [[duration]] minutes Voice Speed Voice Speed 0.75X 1X 1.5X 2X At Google I/O 2026 , we announced our latest models: Gemini Omni and the Gemini 3.5 family of models. Gemini Omni is our new model that can create anything from any input, starting with video. With Omni, you can combine images, audio, video and text as input and generate high-quality videos grounded in Gemini's real-world knowledge. You can also easily edit your videos through conversation. Then there’s Gemini 3.5, our latest family of models combining frontier intelligence with action. This represents a major leap forward in building more capable, intelligent agents. We’re kicking off the series by releasing 3.5 Flash. It delivers frontier performance for agents and coding, excelling at complex long-horizon tasks that deliver real-world utility. To give you a clearer understanding of Gemini Omni and Gemini 3.5 Flash, here are 11 demos of what they can help you do. Gemini Omni Edit your videos through conversation. One capability that makes Omni special is that it gives you an easier way to edit video — with natural language. Every instruction builds on the last. Your characters stay consistent, the physics hold up and the scene remembers what came before. That means you can transform the world around you. Change specific things, or change everything. Your video becomes the starting point for something you never could have filmed yourself. Prompt: Make the sculpture out of bubbles. Reimagine the action. Take a video you shot and just ask Omni to change what’s happening. Edit the action, add in new characters or objects or transform a moment into something unexpected. Prompt: Dim the lights in the room. Put a black and white checkerboard room inside a glass sphere that floats tracking above the hand, inside it contains a recursive representation of the same hand holding the sphere, creating an infinite recursive of rooms. Camera slowly gets closer into the sphere, creating a video loop. Refine your videos across multiple turns. Change the environment, angle, style or even specific details, without ever losing the thread of your original scene. Scroll through the carousel to see how edits build on each other. Prompt: A video of a violinist playing a song. Prompt: Transport the violinist to the image environment Prompt: Make the violin invisible Prompt: Change the camera angle to be over the violinist’s shoulder. Gemini 3.5 Flash Take on agentic tasks at scale. 3.5 Flash delivers intelligence that rivals large flagship models on multiple dimensions, at the speeds you have come to expect from the Flash series. This balance of speed and performance makes 3.5 Flash ideal for tackling long-horizon agentic tasks. Here, powered by Antigravity, 3.5 Flash executes multi-step workflows to automatically rename and categorize unstructured assets based on dynamic criteria. 3.5 Flash powered by Antigravity When coupled with the updated Antigravity harness, 3.5 Flash becomes a powerful engine for deploying collaborative subagents to tackle problems at scale for the most demanding use cases. Under supervision, it can reliably execute multi-step workflows and coding tasks while sustaining frontier performance. Create richer, more interactive web UIs and graphics with 3.5 Flash. 3.5 Flash builds on the strong multimodal foundation of Gemini 3 . Here, powered by Antigravity, 3.5 Flash uses sub-agents to create beautiful visualizations of the mathematical concept of Pi. 3.5 Flash powered by Antigravity You can develop multiple creative concepts in parallel with 3.5 Flash. In this example, 3.5 Flash in Antigravity creates 64 fractal variations at a high speed. 3.5 Flash powered by Antigravity And you can code faster through iterative loops with 3.5 Flash. Watch as 3.5 Flash generates different UX approaches for a checkout flow in just 60 seconds on AI Studio. 3.5 Flash on AI Studio Try personal AI agents and new intelligent experiences. 3.5 Flash is now the default model for the Gemini app and AI Mode in Search globally. Its agentic capabilities are powering new features to bring frontier-level intelligence to your daily life. The enhanced agentic coding capabilities of 3.5 Flash are delivering even more intelligent experiences in Search , like our new information agents. Operating in the background, 24/7, these agents intelligently reason across information to find exactly what you need at exactly the right moment. They will send a comprehensive update along with links to the web to dive deeper, so you can take action. Information agents will launch first for Google AI Pro & Ultra subscribers this summer. An information agent keeps a user updated on whether any of their favorite athletes announce sneaker collabs or signature drops. Now that we’re bringing the power of Google Antigravity and agentic coding capabilities of Gemini 3.5 Flash right into Search, Search can build the ideal response , in the right format for your question — completely on the fly. So you can get custom generative UI, including visual tools and simulations, tailored precisely to your needs. These generative UI capabilities will be available for everyone in Search this summer, free of charge. Search leverages 3.5 Flash to build an interactive visual explaining Gyroid patterns. For your ongoing tasks like planning a wedding or establishing a new fitness routine, Search will also build you custom experiences – like dashboards, trackers or mini apps – that you can keep coming back to. You’ll be able to create your own custom experiences with Antigravity right in Search in the coming months, starting first for Google AI Pro and Ultra subscribers in the U.S. Search builds a custom fitness tracker. Then there’s the new Gemini Spark , your personal AI agent, which runs on Gemini 3.5 and uses the Antigravity harness. It runs 24/7, helping you navigate your digital life, taking action on your behalf while under your direction. It’s deeply integrated with the Workspace tools you rely on daily, like Gmail, Docs, Slides and more. Gemini Spark is now available to all Google AI Ultra subscribers in the U.S. Gemini Spark creates a list of nut-free snacks, then adds them to Instacart. Gemini Omni Flash is rolling out to all Google AI Plus, Pro and Ultra subscribers globally through the Gemini app and Google Flow . It’s also rolling out at no cost to users on YouTube Shorts and YouTube Create App . In the coming weeks, we'll also be rolling it out to developers and enterprise customers via APIs. Gemini 3.5 Flash is generally available via Google Antigravity , the Gemini API in Google AI Studio and Android Studio , Gemini Enterprise Agent Platform and Gemini Enterprise . It’s also available for everyone in AI Mode in Search and now rolling out to everyone globally in the Gemini app . Get more stories from Google in your inbox. Get more stories from Google in your inbox. Email address Your information will be used in accordance with Google's privacy policy. Subscribe Done. Just one step more. Check your inbox to confirm your subscription. You are already subscribed to our newsletter. You can also subscribe with a different email address . POSTED IN: