메뉴
BL
The Decoder 24일 전

클로드 '드리밍' 기능으로 AI 에이전트 과거 오류 학습

IMP
8/10
핵심 요약

Anthropic이 자사의 클로드 매니지드 에이전트 플랫폼에 과거 세션을 분석해 패턴을 학습하고 공유하는 '드리밍(Dreaming)' 기능을 추가했습니다. 이와 함께 에이전트의 결과물을 독립적인 평가자가 검증하는 '아웃컴(Outcomes)'과 여러 전문 에이전트에게 작업을 분산하는 '멀티에이전트 오케스트레이션(Multiagent Orchestration)' 기능도 공개 베타로 전환되어 실제 업무 환경에서 AI 에이전트의 신뢰성과 효율성이 크게 향상될 전망입니다.

번역된 본문

클로드의 새로운 '드리밍(Dreaming)' 기능은 AI 에이전트가 자신의 실수로부터 학습하도록 설계되었습니다.

Anthropic은 4월에 출시한 클로드 매니지드 에이전트(Claude Managed Agents) 플랫폼을 실제 환경에서 AI 에이전트를 더욱 안정적이고 적응력 있게 만들어주는 세 가지 새로운 기능으로 확장했습니다.

새롭게 추가된 '드리밍(Dreaming)'은 과거 에이전트 세션을 검토하고, 패턴을 파악하며, 반복되는 오류나 검증된 워크플로와 같은 인사이트를 여러 세션에 걸쳐 공유하는 프로세스입니다. 기술적으로 드리밍은 비동기 작업으로 실행됩니다. 기존 메모리 저장소와 선택적으로 최대 100개의 과거 세션을 읽어와서, 중복되거나 오래된 항목을 정리한 뒤 이로부터 새롭고 체계화된 메모리를 구축합니다. 이때 원본 메모리는 그대로 보존됩니다. 현재 Claude Opus 4.7 및 Claude Sonnet 4.6 모델을 지원하며, 요금은 표준 API 토큰 가격을 따릅니다.

아웃컴(Outcomes): 별도의 평가자가 고정된 기준에 따라 에이전트 결과 검증

아웃컴(Outcomes)과 멀티에이전트 오케스트레이션(Multiagent Orchestration)이 리서치 프리뷰(연구 미리보기)에서 공개 베타로 전환되었습니다. '아웃컴'을 통해 개발자는 루브릭(Rubric, 채점 기준표)을 정의할 수 있습니다. 이는 "CSV 파일에 숫자 값이 포함된 가격 열이 있어야 한다"와 같은 구체적인 성공 기준이 담긴 문서입니다.

이후 별도의 평가자(Grader)가 자신만의 컨텍스트 창(Context Window)에서 에이전트의 출력물을 이 기준에 따라 확인하며, 이 과정에서 에이전트의 추론에 영향을 받지 않고 독립적으로 평가합니다. 결과가 기준을 충족하지 못하면 평가자가 부족한 부분을 파악하여 알려주고, 에이전트는 기본적으로 최대 3회(최대 20회 시도 가능)까지 작업을 수정합니다.

멀티에이전트 오케스트레이션: 코디네이터가 전문 하위 에이전트에 작업 분배

멀티에이전트 오케스트레이션을 사용하면 리드 에이전트(코디네이터)가 여러 전문 에이전트의 작업을 관리합니다. 각 에이전트는 격리된 컨텍스트와 자체 모델, 시스템 프롬프트 및 전용 도구를 갖춘 독립적인 스레드에서 실행되지만, 모두 동일한 파일 시스템을 공유합니다. 코디네이터는 코드 리뷰와 테스트 생성을 서로 다른 에이전트에 동시에 위임하는 등 작업을 병렬로 분배할 수 있습니다. 이 시스템은 최대 20개의 서로 다른 에이전트와 최대 25개의 스레드를 동시에 실행하는 것을 지원합니다.

현재 '드리밍'은 리서치 프리뷰로 제공되며, 개발자는 클로드 웹사이트의 양식을 통해 액세스를 신청할 수 있습니다. 아웃컴, 멀티에이전트 오케스트레이션 및 메모리 기능은 Anthropic의 매니지드 에이전트 플랫폼의 일부로 공개 베타로 이용 가능합니다. 자세한 내용은 공식 문서, 클로드 블로그 및 클로드 콘솔(Claude Console)에서 확인할 수 있습니다.

원문 보기
원문 보기 (영어)
Claude's new "Dreaming" feature is designed to let AI agents learn from their mistakes Matthias Bastian View the LinkedIn Profile of Matthias Bastian May 7, 2026 Nano Banana Pro prompted by THE DECODER Ask about this article… Search Anthropic is expanding its Claude Managed Agents platform, launched in April, with three new features for making AI agents more reliable and adaptive in real-world use. A novel addition is "Dreaming," a process that reviews past agent sessions, spots patterns, and shares insights across sessions, such as recurring errors or proven workflows. Technically, Dreaming runs as an asynchronous job: it reads an existing memory store and optionally up to 100 past sessions, cleans up duplicates and outdated entries, and builds a new, organized memory from them. The original memory stays intact. Claude Opus 4.7 and Claude Sonnet 4.6 are currently supported, and billing follows standard API token pricing. Ad Outcomes: Separate evaluator checks agent results against fixed criteria Outcomes and Multiagent Orchestration are moving from research preview to public beta. With Outcomes, developers define a rubric: a document with specific success criteria like "The CSV file contains a price column with numerical values." Ad DEC_D_Incontent-1 A separate evaluator (grader) then checks the agent's output against these criteria in its own context window, without being influenced by the agent's reasoning. If the result doesn't meet the specs, the grader identifies the gaps, and the agent revises its work, up to three times by default, with a maximum of 20 attempts. Multiagent orchestration: Coordinator distributes work to specialized sub-agents With multiagent orchestration , a lead agent (coordinator) manages the work of several specialized agents. Each agent runs in its own thread with an isolated context, its own model, system prompt, and dedicated tools, but they all share the same file system. The coordinator can hand out tasks in parallel, like delegating code review and test creation to different agents at the same time. The system supports up to 20 different agents and a maximum of 25 threads running simultaneously. Ad Dreaming is available as a research preview, and developers can request access through a form on the Claude website. Outcomes, Multiagent Orchestration, and Memory are available as public betas as part of Anthropic's Managed Agents platform . More details can be found in the documentation , on the Claude blog , and in the Claude Console . Ad DEC_D_Incontent-2 AI News Without the Hype – Curated by Humans Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section. Subscribe now Source: Anthropic