메뉴
BL
The Decoder 39일 전

구글, 복잡한 연구 자동화 에이전트 딥 리서치 출시

IMP
8/10
핵심 요약

구글이 최신 모델인 Gemini 3.1 Pro 기반의 자율 연구 에이전트인 딥 리서치(Deep Research)와 딥 리서치 맥스(Deep Research Max)를 공개했습니다. 속도를 중시하는 기본 버전과 심층 분석에 특화된 Max 버전을 통해 실시간 상호작용부터 비동기식 백그라운드 작업까지 폭넓은 연구 워크플로우를 자동화할 수 있습니다. 특히 모델 컨텍스트 프로토콜(MCP)을 지원하여 사내 데이터베이스 및 외부 전문 데이터 소스와 연동이 가능해지며, 이는 API를 통한 완전한 형태의 자율 에이전트 구축을 가능하게 하는 핵심 변화입니다.

번역된 본문

구글이 최신 모델인 Gemini 3.1 Pro 기반의 자율 연구 에이전트인 딥 리서치(Deep Research)와 딥 리서치 맥스(Deep Research Max)를 공개했습니다.

두 에이전트 모두 현재 유료 Gemini API 테이어(Tier)를 통해 퍼블릭 프리뷰(Public Preview)로 제공되며, 복잡한 연구 작업을 자동화하려는 개발자들을 타겟으로 합니다. 단 한 번의 API 호출로 전체 연구 워크플로우가 시작되며, 처음으로 오픈 웹과 사내 독점 데이터 스트림을 모두 활용하여 출처가 완벽히 명시된 분석 결과를 제공합니다.

서로 다른 워크로드를 위한 두 가지 버전

표준 딥 리서치 에이전트는 구글이 작년 12월에 공개했던 프리뷰 버전을 대체하며, 더 낮은 지연 시간과 비용으로 품질을 향상시켰습니다. 이는 사용자가 즉각적인 응답을 기대하는 챗봇 인터페이스처럼 속도가 가장 중요한 상황을 위해 설계되었습니다.

반면 딥 리서치 맥스(Deep Research Max)는 속도보다 깊이를 우선시하는 반대 접근 방식을 취합니다. 이 에이전트는 확장된 테스트 타임 컴퓨트(test-time compute)를 활용하여 최종 보고서를 위해 추론, 검색, 반복 작업을 수행합니다. 구글은 아침까지 완전한 실사(Due Diligence) 보고서를 분석가 팀의 책상에 제공하는 야간 크론 작업(Cron Job)처럼 비동기식 백그라운드 워크플로우를 이상적인 활용 사례로 제시합니다.

구글의 자체 벤치마크에서 딥 리서치 맥스는 정보 검색 및 추론 작업에서 큰 성능 향상을 보여주었습니다. 구글에 따르면 이 에이전트는 이전 버전보다 더 많은 출처를 참조하며, 기존 모델이 놓치던 미묘한 차이를 포착해냅니다.

OpenAI의 GPT-5.4 및 Anthropic의 Opus 4.6과의 비교는 완전히 공정한 1:1 비교라고 보기는 어렵습니다. GPT-5.4는 자율 웹 검색에 뛰어나지만 심층 연구(Deep Research)에 최적화되어 있지는 않습니다. 이를 위해 OpenAI는 자체적인 DR 에이전트를 제공하며, 이 에이전트는 2월 업데이트 이후 GPT-5.4가 아닌 GPT-5.2를 사용하도록 전환되었습니다. 참고로 OpenAI의 가장 강력한 검색 모델은 GPT-5.4 Pro이지만, 구글은 이를 비교 대상에서 제외했습니다.

OpenAI에 따르면 GPT-5.4 Pro는 자율 에이전트 검색 벤치마크인 BrowseComp에서 최대 89.3%를 기록했으며, GPT-5.4는 82.7%를 기록했습니다. Anthropic 역시 구글이 제시한 수치보다 높은 84%의 BrowseComp 점수를 Opus 4.6에 대해 보고했습니다. Anthropic은 구글이 API 벤치마크에서 사용한 '높은 추론 강도'로 설정했을 때보다 오히려 추론 기능을 껐을 때 더 나은 성능을 보여 해당 점수를 달성했다고 밝혔습니다.

이러한 격차는 평가 방법론, 즉 모델이 순수 API를 통해 평가되었는지 아니면 각 연구소의 자체 툴링(Tooling)으로 감싸져 평가되었는지의 차이에서 비롯되었을 가능성이 높습니다. 구글의 수치가 반드시 틀렸다는 것은 아니지만, 다소 신중하게 읽어볼 필요가 있습니다. 어느 쪽이든 투명한 방식의 프레젠테이션은 아닙니다.

MCP 지원으로 사내 독점 데이터 연동 가능

가장 큰 변화 중 하나는 모델 컨텍스트 프로토콜(MCP, Model Context Protocol) 지원입니다. 개발자들은 딥 리서치를 재무 또는 시장 데이터 제공업체와 같은 자체 데이터 소스 및 전문 피드(Feed)에 연결할 수 있습니다. 구글은 이 에이전트가 모든 도구 정의를 수용함에 따라 순수 웹 검색기에서 전문 데이터베이스를 쿼리할 수 있는 완전한 자율 에이전트로 전환된다고 설명했습니다.

Gemini API 역사상 처음으로 에이전트는 보고서 내부에 HTML 또는 "Nano Banana" 포맷으로 렌더링된 네이티브 차트 및 인포그래픽을 직접 생성할 수 있어 복잡한 데이터를 시각적으로 표현하기가 훨씬 쉬워졌습니다.

이 외에도 에이전트가 실행되기 전에 사용자가 검색 계획을 검토하고 수정할 수 있는 협업 계획(Collaborative planning) 기능과 PDF, CSV, 이미지, 오디오 등의 멀티모달(Multimodal) 입력을 지원하는 기능이 추가되었습니다.

원문 보기
원문 보기 (영어)
Google launches Deep Research and Deep Research Max agents to automate complex research Matthias Bastian View the LinkedIn Profile of Matthias Bastian Apr 21, 2026 Key Points Google has introduced two autonomous research agents, Deep Research and Deep Research Max, both built on the Gemini 3.1 Pro model. The standard Deep Research version prioritizes speed and low latency for real-time user interactions, while the Max version is designed for maximum thoroughness in asynchronous background tasks by leveraging additional compute time. Both agents support the Model Context Protocol (MCP), enabling connections to proprietary data sources, and are available to developers through the paid Gemini API. Ask about this article… Search Google has launched two new autonomous research agents built on its Gemini 3.1 Pro model: Deep Research and Deep Research Max. Both agents are now in public preview through the paid tiers of the Gemini API , aimed at developers who want to automate heavy-duty research work. A single API call kicks off a full research workflow, and for the first time, the agents can pull from both the open web and proprietary data streams to deliver fully sourced analyses. Two flavors for different workloads The standard Deep Research agent replaces the preview version Google released in December , promising better quality with lower latency and lower cost. It's built for cases where speed matters most, like chat interfaces where users expect an immediate response. Ad Deep Research Max goes the other way, prioritizing depth over speed. The agent uses extended test-time compute to reason, search, and iterate on its final report. Google points to asynchronous background workflows as the ideal use case, like an overnight cron job that drops a full due diligence report on an analyst team's desk by morning. Ad DEC_D_Incontent-1 In Google's own benchmarks, Deep Research Max shows a big jump on retrieval and reasoning tasks. The agent pulls from more sources than the previous version and catches nuances the older model tended to miss, Google says. The comparison with OpenAI's GPT-5.4 and Anthropic's Opus 4.6 isn't quite apples to apples. GPT-5.4 is great at autonomous web search, but it isn't tuned for deep research. For that, OpenAI ships its own DR agent, which switched to GPT-5.2 after the February update , not GPT-5.4. OpenAI's strongest search model is actually GPT-5.4 Pro, which Google apparently left out of the comparison. According to OpenAI , GPT-5.4 Pro hits up to 89.3 percent on the agentic search benchmark BrowseComp, while GPT-5.4 lands at 82.7 percent. Ad Anthropic also reports higher BrowseComp numbers for Opus 4.6 than Google shows, specifically 84 percent. Anthropic says the model hit that score with reasoning turned off, since it actually performed better that way than at the high reasoning intensity Google used in its API benchmark. The gaps likely come down to testing methodology, whether the models were evaluated through the raw API or wrapped in each lab's own tooling. Google's numbers aren't necessarily wrong, but they're worth reading with some caution. Either way, the presentation isn't transparent. Ad DEC_D_Incontent-2 MCP support opens the agent to proprietary data One of the bigger changes is support for the Model Context Protocol (MCP). Developers can wire Deep Research into their own data sources and specialized feeds, like financial or market data providers. By accepting any tool definition, the agent shifts from a pure web searcher to a full autonomous agent that can query specialized databases, Google says. Ad For the first time in the Gemini API, the agent can also generate native charts and infographics directly inside reports, rendered either as HTML or in "Nano Banana" format , making it easier to present complex data visually. Other additions include collaborative planning, which lets users review and tweak the agent's search plan before it runs, multimodal input from PDFs, CSVs, images, audio, and video, and real-time streaming of intermediate steps. Developers can also shut off web access entirely and limit the agent to their own data. Google says the agents run on the same infrastructure that powers research features in its consumer products, including the Gemini app, NotebookLM, Google Search, and Google Finance. Developers can start building custom search workflows through the Interactions API , and both agents will roll out to startups and enterprise customers through Google Cloud soon. AI News Without the Hype – Curated by Humans Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section. Subscribe now Source: Google Blog