메뉴
HN
Hacker News 11일 전

구글 제미나이 3.5, 에이전트 행동 수행 능력 강화

IMP
9/10
핵심 요약

구글 딥마인드가 최신 AI 모델 패밀리인 제미나이 3.5를 공개하며, 첫 모델로 고성능 에이전트 및 코딩 작업에 특화된 3.5 Flash를 출시했습니다. 이번 모델은 기존 대비 4배 빠른 속도를 제공하면서도 복잡한 다단계 에이전트 워크플로와 멀티모달 이해도에서 최고 수준의 성능을 기록하는 것이 핵심입니다. 또한 '안티그래비티(Antigravity)' 플랫폼과 결합하여 개발 및 엔터프라이즈 환경에서 실질적인 업무 자동화 및 문제 해결을 대규모로 수행할 수 있습니다.

번역된 본문

제미나이 3.5: 실행력을 갖춘 최첨단 지능 2026년 5월 19일

제미나이 3.5(Gemini 3.5)는 복잡한 에이전트 워크플로우(agentic workflows)를 실행하도록 구축되었습니다.

  • 코라이 카부크쿠올루(Koray Kavukcuoglu), 구글 딥마인드 CTO 겸 구글 최고 AI 설계자
  • 제프 딘(Jeff Dean), 구글 딥마인드 및 구글 리서치 수석 과학자
  • 오리올 비냘스(Oriol Vinyals), 구글 딥마인드 부사장
  • 노암 샤지어(Noam Shazeer), 구글 딥마인드 부사장

오늘, 우리는 최첨단 지능과 실행력을 결합한 최신 모델 패밀리인 제미나이 3.5를 소개합니다. 이는 더 유능하고 지능적인 에이전트를 구축하는 데 있어 중대한 도약을 의미합니다. 우리는 이 시리즈의 시작으로 3.5 Flash를 출시합니다. 이 모델은 에이전트 및 코딩 작업에서 최고 수준의 성능을 발휘하며, 실질적인 유용성을 제공하는 복잡한 장기 작업(long-horizon tasks)에 탁월합니다.

3.5 Flash는 오늘부터 전 세계 수십억 명에게 제공됩니다:

  • 모든 사용자: 제미나이 앱 및 구글 검색의 AI 모드를 통해
  • 개발자: 에이전트 중심 개발 플랫폼인 구글 안티그래비티(Antigravity), 구글 AI 스튜디오 및 안드로이드 스튜디오의 제미나이 API를 통해
  • 기업: 제미나이 엔터프라이즈 에이전트 플랫폼 및 제미나이 엔터프라이즈를 통해

또한 우리는 3.5 Pro 개발에도 박차를 가하고 있습니다. 이 모델은 이미 내부적으로 사용되고 있으며, 다음 달에 공개할 수 있기를 기대하고 있습니다.

3.5 Flash: 에이전트 및 코딩을 위한 최고 수준의 성능 제미나이 3.5 Flash는 Flash 시리즈에서 기대할 수 있는 속도를 유지하면서도 여러 측면에서 대형 플래그십 모델과 필적하는 지능을 제공합니다. 이것은 지금까지 개발한 가장 강력한 에이전트 및 코딩 모델로, Terminal-Bench 2.1 (76.2%), GDPval-AA (1656 Elo), MCP Atlas (83.6%)와 같은 까다로운 코딩 및 에이전트 벤치마크에서 제미나이 3.1 Pro를 능가하며, 멀티모달 이해력(CharXiv Reasoning 84.2%)에서도 선두를 달리고 있습니다.

초당 출력 토큰(output tokens per second) 측면에서 다른 최첨단 모델보다 4배 빠릅니다. Artificial Analysis 지수의 우측 상단 사분면에 위치한 3.5 Flash는 예외적인 속도로 최고 수준의 지능을 제공하여, 품질과 지연 시간 사이에서 더 이상 타협할 필요가 없음을 증명합니다.

3.5 Flash: 대규모 에이전트 작업 이러한 속도와 성능의 균형은 3.5 Flash가 장기적인 에이전트 작업을 처리하는 데 이상적입니다. 예전에는 개발자가 며칠이 걸리거나 감사관이 몇 주가 걸리던 작업을 이제 3.5 Flash가 다른 최첨단 모델의 절반 이하의 비용으로도 훨씬 짧은 시간 안에 완료할 수 있도록 도와줍니다. 새로운 애플리케이션을 개발하든, 코드베이스를 유지 관리하든, 재무 문서 준비를 돕든, 이 모델은 실제 문제를 해결하기 위해 신속하게 계획, 구축 및 반복(Iteration) 작업을 수행합니다.

업데이트된 안티그래비티(Antigravity) 하네스와 결합된 3.5 Flash는 가장 까다로운 사용 사례에 대해 대규모 문제를 해결하기 위해 협업 하위 에이전트(subagents)를 배포하는 강력한 엔진 역할을 합니다. 감독 하에 다단계 워크플로우와 코딩 작업을 안정적으로 실행하면서 최고 수준의 성능을 유지합니다.

  • 안티그래비티를 활용하여 3.5 Flash는 다단계 워크플로우를 실행해 동적 기준에 따라 비정형 데이터를 자동으로 이름 변경 및 분류합니다.
  • 안티그래비티를 활용해 3.5 Flash는 두 개의 에이전트를 사용하여 AlphaZero 논문을 종합하고 6시간 만에 완벽하게 플레이 가능한 게임을 코드로 작성합니다.
  • 3.5 Flash는 안티그래비티 하네스를 사용하여 복잡한 레거시 코드베이스를 Next.js로 변환합니다.
  • 3.5 Flash는 하위 에이전트를 사용하여 안티그래비티 내에 새로운 도시 경관을 만들어냅니다.
  • 3.5 Flash는 빌더(builder)와 플레이어(player)라는 두 에이전트를 사용하여 빠른 자가 개선 루프(self-improvement loop)를 통해 안티그래비티에서 게임을 개발합니다.

제미나이 3의 강력한 멀티모달 기반을 바탕으로, 3.5 Flash는 더 풍부하고 인터랙티브한 웹 UI 및 그래픽을 생성합니다.

  • 3.5 Flash는 AI 스튜디오에서 연구 논문을 위한 인터랙티브 애니메이션을 생성합니다.
  • 3.5 Flash는 단순한 텍스트 설명을 AI 스튜디오에서 인터랙티브 하드웨어로 변환합니다.
  • 3.5 Flash는 여러 컨셉을 병렬로 실행하여 학교 모금 행사를 위한 완전한 브랜딩 컨셉을 AI 스튜디오에서 구축합니다.
  • 3.5 Flash는 단 60초 만에 결제 흐름을 위한 다양한 UX 접근 방식을 AI 스튜디오에서 생성합니다.

3.5 Flash: 실질적인 영향력 3.5 Flash의 실제 에이전트 기능은 이미 의미 있는 진전을 이끌고 있습니다...

원문 보기
원문 보기 (영어)
Gemini 3.5: frontier intelligence with action May 19, 2026 · Share x.com Facebook LinkedIn Mail Copy link Gemini 3.5 is built to help you execute complex, agentic workflows. Koray Kavukcuoglu CTO, Google DeepMind and Chief AI Architect, Google Jeff Dean Chief Scientist, Google DeepMind and Google Research Oriol Vinyals Vice President, Google DeepMind Noam Shazeer Vice President, Google DeepMind Share x.com Facebook LinkedIn Mail Copy link Today, we’re introducing Gemini 3.5, our latest family of models combining frontier intelligence with action. This represents a major leap forward in building more capable, intelligent agents. We’re kicking off the series by releasing 3.5 Flash. It delivers frontier performance for agents and coding, excelling at complex long-horizon tasks that deliver real-world utility. 3.5 Flash is available today to billions of people globally: For everyone via the Gemini app and AI Mode in Google Search For developers in our agent-first development platform Google Antigravity and Gemini API in Google AI Studio and Android Studio; and For enterprises in Gemini Enterprise Agent Platform and Gemini Enterprise. We’re also hard at work on 3.5 Pro. It's already being used internally, and we look forward to rolling it out next month. 3.5 Flash: frontier performance for agents and coding Gemini 3.5 Flash delivers intelligence that rivals large flagship models on multiple dimensions, at the speeds you have come to expect from the Flash series. It’s our strongest agentic and coding model yet, outperforming Gemini 3.1 Pro on challenging coding and agentic benchmarks like Terminal-Bench 2.1 (76.2%), GDPval-AA (1656 Elo) and MCP Atlas (83.6%), and leading in multimodal understanding (84.2% on CharXiv Reasoning). When looking at output tokens per second, it is 4 times faster than other frontier models. Landing in the top-right quadrant of the Artificial Analysis index, 3.5 Flash delivers frontier-level intelligence at exceptional speed — proving you no longer have to trade quality for latency. 3.5 Flash: agentic tasks at scale This balance of speed and performance makes 3.5 Flash ideal for tackling long-horizon agentic tasks. What used to take a developer days or an auditor weeks, 3.5 Flash can now help complete in a fraction of the time, often at less than half the cost of other frontier models. It rapidly plans, builds and iterates to solve real-world problems, whether it’s developing new applications, maintaining codebases or helping to prepare financial documents. When coupled with the updated Antigravity harness, 3.5 Flash becomes a powerful engine for deploying collaborative subagents to tackle problems at scale for the most demanding use cases. Under supervision, it can reliably execute multi-step workflows and coding tasks while sustaining frontier performance. Powered by Antigravity, 3.5 Flash executes multi-step workflows to automatically rename and categorize unstructured assets based on dynamic criteria. Leveraging Antigravity, 3.5 Flash uses two agents to synthesize the AlphaZero paper and code a fully playable game in six hours. 3.5 Flash uses the Antigravity harness to transform a messy legacy codebase to Next.js. 3.5 Flash uses subagents to create new city landscapes in Antigravity. 3.5 Flash uses two agents: a builder and a player, working in a rapid self-improvement loop to develop a game in Antigravity. Building on the strong multimodal foundation of Gemini 3, 3.5 Flash generates richer, more interactive web UIs and graphics. 3.5 Flash creates interactive animations for a research paper on AI Studio. 3.5 Flash turns a plain text description into interactive hardware on AI Studio. 3.5 Flash executes multiple concepts in parallel to build a full branding concept for a school fundraiser on AI Studio. 3.5 Flash generates different UX approaches for a checkout flow in just 60 seconds on AI Studio. 3.5 Flash: real-world impact 3.5 Flash’s real-world agentic capabilities are already driving meaningful progress for our developers and enterprises alike. In developing the 3.5 model series, we worked closely with industry partners to understand where toil and complexity arose in their workflows. Partners are seeing meaningful impact — from banks and fintechs automating multi-week workflows to data science teams unearthing insights amidst complex data environments. Shopify is running subagents in parallel to analyze complex data over a long horizon for more accurate merchant growth forecasts at a global scale. Macquarie Bank is piloting how 3.5 Flash can accelerate customer onboarding by reasoning over complex 100+ page documents, retrieving relevant information and making reliable recommendations with low latency. Salesforce is integrating 3.5 Flash into Agentforce to reliably automate complicated enterprise tasks by deploying multiple subagents that retain context and execute complex, multi-turn tool calling. 3.5 Flash is helping Ramp enable smarter, more reliable OCR through multimodal understanding of complex invoices combined with reasoning over historical patterns. Xero is deploying agents to autonomously manage complex, multi-week workflows, such as identifying suppliers and gathering information for 1099 tax forms, enabling small businesses to automate tedious admin tasks. Databricks is using agentic workflows to monitor and retrieve real-time information, reason across massive datasets to diagnose issues, identify fixes and propose solutions for data scientists. Personal AI agents: built with 3.5 Flash 3.5 Flash is now the default model for the Gemini app and AI Mode in Search globally. At I/O today, we showed how its agentic capabilities are powering new features to bring frontier-level intelligence to your daily life. The new Gemini Spark, your personal AI agent, uses 3.5 Flash. It runs 24/7, helping you navigate your digital life, taking action on your behalf while under your direction. We’re starting to roll out Gemini Spark to trusted testers today, and we’re planning on bringing the Beta to Google AI Ultra subscribers in the US next week. Gemini Spark uses 3.5 Flash to help accomplish these tasks Gemini Spark uses 3.5 Flash to help accomplish these tasks Gemini Spark uses 3.5 Flash to help accomplish these tasks Gemini Spark uses 3.5 Flash to help accomplish these tasks Gemini Spark uses 3.5 Flash to help accomplish these tasks The enhanced agentic coding capabilities of 3.5 Flash are also delivering even more intelligent experiences across Search, from introducing new information agents that work for you 24/7 to unlocking more dynamic generative UI experiences. Learn more in our blog post . Search leverages 3.5 Flash to build an interactive visual explaining Gyroid patterns. Gemini 3.5: built with frontier safeguards Gemini 3.5 was developed in accordance with our Frontier Safety Framework. We have strengthened our cyber and CBRN safeguards, which means it's less likely to generate harmful content, and to mistakenly refuse to answer safe queries. We achieve this with new, more advanced safety training and mitigations, including interpretability tools that help check and understand the AI's inner reasoning before it provides a response. 3.5 Flash is available today Gemini 3.5 Flash is generally available via Google Antigravity, the Gemini API in Google AI Studio and Android Studio, Gemini Enterprise Agent Platform and Gemini Enterprise. It’s also now available to everyone in the Gemini app and AI Mode in Search. On behalf of the entire Gemini team, we can’t wait to see what you build. Get more stories from Google in your inbox. Get more stories from Google in your inbox. Email address Your information will be used in accordance with Google's privacy policy. Subscribe Done. Just one step more. Check your inbox to confirm your subscription. You are already subscribed to our newsletter. You can also subscribe with a different email address . POSTED IN: