클로드 '드리밍' 기능으로 AI 에이전트 과거 오류 학습
Anthropic이 자사의 클로드 매니지드 에이전트 플랫폼에 과거 세션을 분석해 패턴을 학습하고 공유하는 '드리밍(Dreaming)' 기능을 추가했습니다. 이와 함께 에이전트의 결과물을 독립적인 평가자가 검증하는 '아웃컴(Outcomes)'과 여러 전문 에이전트에게 작업을 분산하는 '멀티에이전트 오케스트레이션(Multiagent Orchestration)' 기능도 공개 베타로 전환되어 실제 업무 환경에서 AI 에이전트의 신뢰성과 효율성이 크게 향상될 전망입니다.
클로드의 새로운 '드리밍(Dreaming)' 기능은 AI 에이전트가 자신의 실수로부터 학습하도록 설계되었습니다.
Anthropic은 4월에 출시한 클로드 매니지드 에이전트(Claude Managed Agents) 플랫폼을 실제 환경에서 AI 에이전트를 더욱 안정적이고 적응력 있게 만들어주는 세 가지 새로운 기능으로 확장했습니다.
새롭게 추가된 '드리밍(Dreaming)'은 과거 에이전트 세션을 검토하고, 패턴을 파악하며, 반복되는 오류나 검증된 워크플로와 같은 인사이트를 여러 세션에 걸쳐 공유하는 프로세스입니다. 기술적으로 드리밍은 비동기 작업으로 실행됩니다. 기존 메모리 저장소와 선택적으로 최대 100개의 과거 세션을 읽어와서, 중복되거나 오래된 항목을 정리한 뒤 이로부터 새롭고 체계화된 메모리를 구축합니다. 이때 원본 메모리는 그대로 보존됩니다. 현재 Claude Opus 4.7 및 Claude Sonnet 4.6 모델을 지원하며, 요금은 표준 API 토큰 가격을 따릅니다.
아웃컴(Outcomes): 별도의 평가자가 고정된 기준에 따라 에이전트 결과 검증
아웃컴(Outcomes)과 멀티에이전트 오케스트레이션(Multiagent Orchestration)이 리서치 프리뷰(연구 미리보기)에서 공개 베타로 전환되었습니다. '아웃컴'을 통해 개발자는 루브릭(Rubric, 채점 기준표)을 정의할 수 있습니다. 이는 "CSV 파일에 숫자 값이 포함된 가격 열이 있어야 한다"와 같은 구체적인 성공 기준이 담긴 문서입니다.
이후 별도의 평가자(Grader)가 자신만의 컨텍스트 창(Context Window)에서 에이전트의 출력물을 이 기준에 따라 확인하며, 이 과정에서 에이전트의 추론에 영향을 받지 않고 독립적으로 평가합니다. 결과가 기준을 충족하지 못하면 평가자가 부족한 부분을 파악하여 알려주고, 에이전트는 기본적으로 최대 3회(최대 20회 시도 가능)까지 작업을 수정합니다.
멀티에이전트 오케스트레이션: 코디네이터가 전문 하위 에이전트에 작업 분배
멀티에이전트 오케스트레이션을 사용하면 리드 에이전트(코디네이터)가 여러 전문 에이전트의 작업을 관리합니다. 각 에이전트는 격리된 컨텍스트와 자체 모델, 시스템 프롬프트 및 전용 도구를 갖춘 독립적인 스레드에서 실행되지만, 모두 동일한 파일 시스템을 공유합니다. 코디네이터는 코드 리뷰와 테스트 생성을 서로 다른 에이전트에 동시에 위임하는 등 작업을 병렬로 분배할 수 있습니다. 이 시스템은 최대 20개의 서로 다른 에이전트와 최대 25개의 스레드를 동시에 실행하는 것을 지원합니다.
현재 '드리밍'은 리서치 프리뷰로 제공되며, 개발자는 클로드 웹사이트의 양식을 통해 액세스를 신청할 수 있습니다. 아웃컴, 멀티에이전트 오케스트레이션 및 메모리 기능은 Anthropic의 매니지드 에이전트 플랫폼의 일부로 공개 베타로 이용 가능합니다. 자세한 내용은 공식 문서, 클로드 블로그 및 클로드 콘솔(Claude Console)에서 확인할 수 있습니다.