구글 I/O 2026: AI 에이전트 최적화 'Gemini 3.5 Flash' 공개
구글이 2026년 5월 I/O 컨퍼런스에서 AI 에이전트 및 코딩 작업에 최적화된 첫 번째 3.5 시리즈 모델인 'Gemini 3.5 Flash'를 발표했습니다. 이 모델은 기존 최상위 모델이었던 Gemini 3.1 Pro를 주요 벤치마크에서 능가하면서도 출력 속도는 4배 빠르고 비용은 절반 수준으로 제공합니다. 더불어 단일 API 호출로 복잡한 에이전트 환경을 구축할 수 있는 'Managed Agents API'와 개발 플랫폼 'Antigravity 2.0'을 선보이며, 쇼피파이, 세일즈포스 등 글로벌 기업들을 통한 대규모 실무 배치에도 돌입했습니다.
구글이 2026년 5월 구글 I/O에서 'Gemini 3.5 Flash'를 발표했습니다. 이 모델은 Gemini 3.5 시리즈의 첫 번째 버전입니다. 이 시리즈는 최고 수준의 지능과 실행(Action) 능력을 결합했습니다. 구글은 이를 지능형 에이전트를 위한 중대한 도약이라고 부릅니다. 기존 Flash 등급은 항상 더 빠르고 저렴했습니다. 3.5 Flash는 까다로운 벤치마크에서 Gemini 3.1 Pro를 능가합니다. 이전 프리미엄 등급을 이제 뛰어넘은 것입니다.
벤치마크 결과 Gemini 3.5 Flash는 코딩 성능을 테스트하는 Terminal-Bench 2.1에서 76.2%를 기록했습니다. 실제 에이전트 작업 성능을 측정하는 GDPval-AA에서 1656 Elo를 기록했습니다. 대규모 도구 사용 안정성을 측정하는 MCP Atlas에서는 83.6%를 기록했습니다. 멀티모달 이해도를 평가하는 CharXiv Reasoning 벤치마크에서는 84.2%를 기록했습니다.
Gemini 3.5 Flash는 출력 토큰(Output Token) 처리 속도가 4배 빠릅니다. 작업 완료에 드는 비용은 종종 절반 이하입니다. 공식 가격은 백만 입력 토큰당 1.50달러입니다. 출력 토큰은 백만 개당 9.00달러입니다. 캐시된 입력(Cached input)은 백만 개당 0.15달러로 책정되었습니다. 컨텍스트 윈도우(Context window)는 1,048,576개의 입력 토큰을 지원합니다. 최대 출력은 65,536 토큰입니다. 텍스트, 이미지, 오디오, 비디오 입력을 지원합니다. 지식 기준일(Knowledge cutoff)은 2026년 1월입니다. 동적 사고(Dynamic thinking)가 기본적으로 활성화되어 있습니다. 이 모델은 더 어려운 문제에 대해 자동으로 더 많은 컴퓨팅 자원을 할당합니다.
에이전트 및 장기(LONG-HORIZON) 작업을 위해 설계됨 여기서 '에이전트(Agentic)'는 모델이 스스로 계획하고, 도구를 호출하며, 반복 작업을 수행한다는 의미입니다. 단순한 단일 질문에 답하는 대신 다단계 목표를 완수합니다. '장기(Long-horizon)'는 그러한 루프가 오랜 시간 동안 실행됨을 의미합니다. 구글은 Gemini API에 'Managed Agents'를 도입했습니다. 단 한 번의 API 호출로 완전한 에이전트가 가동됩니다. 이 에이전트는 추론하고, 도구를 사용하며, 코드를 실행합니다. 실행 환경은 격리된 리눅스 컨테이너 내에서 작동합니다. 파일과 상태는 후속 API 호출 시에도 유지됩니다. 이를 통해 끊김 없는 멀티턴 에이전트 세션이 가능해집니다. 이전에는 에이전트 상태와 환경을 수동으로 관리해야 했습니다. Managed Agents API는 이러한 인프라를 완전히 추상화합니다.
안티그래비티(Antigravity) 생태계 구글 안티그래비티(Antigravity)는 에이전트 우선 개발 플랫폼입니다. 아이디어를 프로덕션 준비가 완료된 애플리케이션으로 전환해 줍니다. 안티그래비티 2.0은 새로운 독립형 데스크톱 애플리케이션입니다. 병렬로 실행되는 여러 에이전트를 조율합니다. 동적 서브 에이전트(Subagents)가 병렬화된 워크플로우를 처리합니다. 예약된 작업을 통해 백그라운드 자동화를 가능하게 합니다. 구글 AI 스튜디오, 안드로이드(Android), 파이어베이스(Firebase)와의 통합을 지원합니다. 안티그래비티 CLI는 터미널 기반 개발자를 위한 도구입니다. GUI 없이도 에이전트를 즉시 생성할 수 있습니다. 구글은 기존 Gemini CLI 사용자들에게 지금 바로 마이그레이션할 것을 권장합니다. 안티그래비티 SDK는 프로그래밍 방식으로 개발 하네스(Harness)에 접근할 수 있게 해줍니다. 이를 통해 사용자 지정 에이전트 동작을 정의하고 원하는 인프라에 에이전트를 호스팅할 수 있습니다.
실제 기업 환경의 배치 사례 구글에 따르면 여러 기업 파트너가 이미 3.5 Flash를 운영하고 있습니다. 쇼피파이(Shopify)는 데이터 분석을 위해 서브 에이전트를 병렬로 실행하고 있으며, 이를 통해 전 세계적인 판매자 성장 예측의 정확도를 높이고 있습니다. 맥쿼리 은행(Macquarie Bank)은 고객 온보딩에 파일럿 테스트를 진행 중이며, 이 모델이 100페이지가 넘는 복잡한 문서를 분석해 정보를 검색하고 신뢰할 수 있는 권장 사항을 제시합니다. 세일즈포스(Salesforce)는 Agentforce에 3.5 Flash를 통합하여 여러 서브 에이전트를 사용해 기업의 작업을 자동화하고 있으며, 서브 에이전트는 복잡한 멀티턴 도구 호출 과정에서도 문맥을 유지합니다. 램프(Ramp)는 송장 처리에 더 스마트한 OCR을 적용하며 멀티모달 이해와 기존 패턴 추론을 결합하고 있습니다. 제로(Xero)는 수 주에 걸친 복잡한 워크플로우를 위해 에이전트를 배치했으며, 1099 양식용 공급업체 데이터 수집이 그 예시입니다. 데이터브릭스(Databricks)는 실시간 데이터 모니터링을 위해 에이전트 워크플로우를 사용하며, 이 모델이 문제를 진단하고 엔지니어에게 수정 방안을 제안합니다.
기술적 세부 사항(Technical details)을 확인해 보세요. 또한 트위터(Twitter)에서 저희를 팔로우하고, 15만 명 이상의 ML 서브레딧(SubReddit)에 참여하며, 뉴스레터를 구독해 주시기를 망설이지 마세요. 잠깐! 텔레그램(Telegram)을 사용하고 계신가요? 이제 텔레그램에서도 저희와 함께하실 수 있습니다. GitHub 리포지토리, Hugging Face 페이지, 제품 출시, 웨비나 등의 홍보를 위해 저희와 파트너십을 맺고 싶으신가요? Michal Sutter와 연락해 주세요.