메뉴
BL
r/singularity 39일 전

구글, 심층 연구 에이전트 '딥 리서치' 공개

IMP
9/10
핵심 요약

구글 딥마인드가 자체 최고급 모델인 '제미나이 3.1 프로(Gemini 3.1 Pro)'를 탑재한 새로운 자율 연구 에이전트 '딥 리서치(Deep Research)'와 '딥 리서치 맥스(Deep Research Max)'를 발표했습니다. 이번 업데이트를 통해 단순한 웹 검색을 넘어 기업 내부 데이터베이스와 전문 데이터 스트림을 연동하는 MCP(모델 컨텍스트 프로토콜)를 지원하며, 텍스트 기반 결과물에 더해 프레젠테이션 바로 사용 가능한 수준의 인포그래픽과 차트를 네이티브로 생성하는 것이 가장 큰 특징입니다.

번역된 본문

딥 리서치 맥스: 자율 연구 에이전트의 혁신적 도약 2026년 4월 21일

제미나이 3.1 프로(Gemini 3.1 Pro)로 구축된 새로운 딥 리서치(Deep Research) 에이전트는 MCP 지원, 네이티브 시각화 및 전례 없는 분석 품질을 웹 또는 맞춤형 소스에 걸친 장기 연구 워크플로우에 제공합니다.

루카스 하스(Lukas Haas), 구글 딥마인드 프로덕트 매니저 스리니바스 타데팔리(Srinivas Tadepalli), 구글 딥마인드 프로그램 매니저

작년 12월, 우리는 인터랙션 API(Interactions API)를 통해 개발자들에게 제미나이 딥 리서치 에이전트를 공개하여, 구글의 가장 진보된 자율 연구 기능에 접근할 수 있도록 했습니다. 오늘, 우리는 자율 연구 에이전트의 두 가지 새로운 발전을 통해 이러한 기능을 한 차원 더 높은 수준으로 끌어올리고자 합니다. 바로 '딥 리서치'와 '딥 리서치 맥스'입니다.

가장 진보된 모델인 제미나이 3.1 프로의 통합을 통해, 딥 리서치는 정교한 요약 엔진에서 금융, 생명 과학, 시장 조사 등 다양한 산업 분야의 기업 워크플로우 기반으로 변모했습니다. 딥 리서치의 보고서는 그 자체로도 큰 가치를 제공하지만, 종종 심층적인 맥락 수집으로 시작되는 복잡하고 에이전트 중심의 파이프라인에서 첫 번째 단계로서의 역할도 훌륭하게 수행합니다. 이제 개발자는 단일 API 호출만으로 철저한 연구 워크플로우를 실행할 수 있으며, 공개된 웹 데이터와 자체적인 데이터 스트림을 최초로 혼합하여 전문가 수준의 완벽하게 출처가 명시된 분석 결과를 얻을 수 있습니다.

워크플로우에 맞는 연구 구성 선택 지난 12월의 제미나이 딥 리서치 프리뷰(Preview) 출시를 바탕으로, 우리는 직접적인 사용자 지원부터 대규모 오프라인 연구 프로세스에 이르기까지 다양한 요구를 충족하기 위해 설계된 두 가지 독특한 에이전트를 소개합니다.

  • 딥 리서치: 속도와 효율성에 최적화된 이 새로운 에이전트는 작년 12월에 출시된 프리뷰 버전을 대체하며, 더 높은 품질 수준에서 대기 시간(Latency)과 비용을 크게 줄여줍니다. 짧은 응답 시간이 요구되는 대화형 사용자 인터페이스에 직접 통합되는 연구 환경에 이상적인 에이전트입니다.
  • 딥 리서치 맥스: 최대의 포괄성과 최고 수준의 데이터 종합 능력을 위해 설계된 맥스(Max) 버전은 확장된 테스트 타임 컴퓨트(Test-time compute)를 활용하여 반복적으로 추론, 검색 및 최종 보고서를 다듬습니다. 예를 들어, 야간 크론탭(Cron job)을 통해 아침까지 분석가 팀을 위한 철저한 실사(Due Diligence) 보고서 생성을 트리거하는 것과 같은 비동기식 백그라운드 워크플로우를 위한 완벽한 엔진입니다. 딥 리서치 맥스는 정보 검색 및 추론 능력을 추적하는 업계 표준 벤치마크에서 성능의 비약적인 도약을 보여줍니다.

독점 데이터 연동 및 풍부한 네이티브 시각화 기능 이제 딥 리서치는 웹, 임의의 원격 MCP, 파일 업로드 및 연결된 파일 저장소를 검색하거나, 이들의 일부 또는 전체를 혼합하여 검색할 수 있습니다. 이는 전문가들이 매일 의존하는 복잡하고 접근이 제한된 데이터 환경을 처리하기 위해 설계된 기능을 도입한 것입니다.

  • 모델 컨텍스트 프로토콜(MCP) 지원: 이제 MCP를 통해 딥 리서치를 맞춤형 데이터 및 전문적인 데이터 스트림(예: 금융 또는 시장 데이터 제공업체)에 안전하게 연결할 수 있습니다. 딥 리서치는 임의의 도구 정의를 지원하므로, 단순한 웹 검색기를 넘어 모든 전문 데이터 저장소를 탐색할 수 있는 자율 에이전트로 변모합니다.
  • 네이티브 차트 및 인포그래픽: 제미나이 API를 통한 딥 리서치의 첫 번째 기록으로, 이제 에이전트가 단순히 텍스트만 생성하는 것이 아니라 HTML 또는 나노 바나나(Nano Banana)를 사용하여 고품질 차트와 인포그래픽을 인라인으로 네이티브 생성하여 복잡한 데이터 세트를 동적으로 시각화하고 분석 보고서를 더욱 풍부하게 만듭니다. 딥 리서치는 복잡한 정성적, 정량적 데이터 스트림을 프레젠테이션에 바로 사용할 수 있는 차트와 인포그래픽으로 변환하는 풍부한 시각적 요소를 기본적으로 생성합니다.
원문 보기
원문 보기 (영어)
Deep Research Max: a step change for autonomous research agents Apr 21, 2026 · Share x.com Facebook LinkedIn Mail Copy link Built with Gemini 3.1 Pro, the new Deep Research agents bring MCP support, native visualizations and unprecedented analytical quality to long-horizon research workflows across the web or custom sources. Lukas Haas Product Manager, Google DeepMind Srinivas Tadepalli Program Manager, Google DeepMind Share x.com Facebook LinkedIn Mail Copy link Your browser does not support the audio element. Listen to article This content is generated by Google AI. Generative AI is experimental [[duration]] minutes Voice Speed Voice Speed 0.75X 1X 1.5X 2X In December , we released the Gemini Deep Research agent to developers via the Interactions API , giving developers access to Google’s most advanced autonomous research capabilities. Today, we are taking these capabilities to the next level with two new evolutions of our autonomous research agent: Deep Research and Deep Research Max. With the integration of our most advanced model, Gemini 3.1 Pro, Deep Research has transformed from a sophisticated summarization engine into a foundation for enterprise workflows across finance, life sciences, market research, and more. Deep Research’s reports offer value on their own, but also serve as the first step in complex, agentic pipelines which often start with in-depth context gathering. With a single API call, developers can now trigger exhaustive research workflows that for the first time blend the open web with their proprietary data streams to deliver professional-grade, fully cited analyses. Choose a research configuration that fits your workflow Building upon our initial release of Gemini Deep Research, we’re introducing two distinct agents designed to match your needs ranging from direct user assistance to large-scale, offline research processes: Deep Research: Optimized for speed and efficiency, this new agent replaces our preview release from December and delivers significantly reduced latency and cost at higher quality levels. It is the ideal agent for research experiences integrated directly into interactive user surfaces where lower latency is desired. Deep Research Max: Designed for maximum comprehensiveness and highest-quality synthesis, Max leverages extended test-time compute to iteratively reason, search and refine the final report. It is the perfect engine for asynchronous, background workflows such as a nightly cron job triggering the generation of exhaustive due diligence reports for an analyst team by morning. Deep Research Max represents a leap in performance across industry-standard benchmarks tracking retrieval and reasoning capabilities. Unlock proprietary data and rich native visuals Deep Research can now search the web, arbitrary remote MCPs, file uploads and connected file stores — or any subset of them — introducing capabilities designed to handle the complex, gated data universes that professionals rely on daily. Model Context Protocol (MCP) support: You can now seamlessly connect Deep Research to your custom data and specialized professional data streams (such as financial or market data providers) securely via MCP. Deep Research supports arbitrary tool definitions which transforms it from a web searcher into an autonomous agent capable of navigating any specialized data repositories. Native charts and infographics: A first for Deep Research in the Gemini API, our agent no longer just creates text; it natively generates high-quality charts and infographics in-line with HTML or Nano Banana , dynamically visualizing complex data sets to enrich analytical reports. Deep Research natively generates rich visual elements, turning complex qualitative and quantitative data streams into presentation-ready charts and infographics. Deep Research natively generates rich visual elements, turning complex qualitative and quantitative data streams into presentation-ready charts and infographics. Deep Research natively generates rich visual elements, turning complex qualitative and quantitative data streams into presentation-ready charts and infographics. Deep Research natively generates rich visual elements, turning complex qualitative and quantitative data streams into presentation-ready charts and infographics. We’ve also expanded the agent's capabilities to provide more control and transparency over the research process: Collaborative planning: Review, guide and refine the research plan generated by the agent before it begins execution, providing granular control over the investigation's scope. Extended tooling: Combine the full suite of Gemini API tooling. Run Deep Research with Google Search, remote MCP servers, URL Context, Code Execution and File Search simultaneously — or turn off web access entirely to exclusively search over your custom data. Multimodal research grounding: Provide a combination of PDFs, CSVs, images, audio and video as input to ground the agent's research in your custom context. Real-time streaming: Track the agent's intermediate reasoning steps with live thought summaries, and receive text and image outputs as they are generated, particularly useful for interactive user surfaces. Drive real-world results with expert-grade analysis Deep Research Max delivers highly comprehensive reports, rigorous factuality and expert-grade analysis cheaper and more efficiently than ever before. Compared to our December release, Deep Research Max consults significantly more sources and identifies critical nuances the older release frequently overlooked. We have also focused on teaching Deep Research to consult a diverse array of sources and carefully weighing conflicting evidence against each other. The result is a nuanced report that draws from authoritative sources like SEC filings and open-access peer-reviewed journals, lays out information well and transforms dense technical data into actionable, stakeholder-ready formats. To make sure this tech delivers real-world results, we’re working closely with startups and enterprises in specialized and regulated fields where there is little margin for error, particularly in finance and the life sciences. For example, we are actively collaborating with FactSet , S&P Global and PitchBook on their MCP server designs to let shared customers integrate financial data offerings into workflows powered by Deep Research, and to enable them to realize a leap in productivity by gathering context using their exhaustive data universes at lightning speed. Take advantage of proven Google scale performance When you build with the Deep Research agent, you are tapping into the same autonomous research infrastructure that powers research capabilities within some of Google’s most popular products like Gemini App , NotebookLM , Google Search and Google Finance . Get started with Deep Research in the Interactions API Deep Research and Deep Research Max are available starting today in public preview via paid tiers in the Gemini API. Head over to our developer documentation to start building with Deep Research using the Interactions API . Deep Research and Deep Research Max will also soon be available to startups and enterprises in Google Cloud. POSTED IN: