메뉴
BL
r/singularity 51일 전

클로드, '어드바이저 전략' 도입

IMP
8/10
핵심 요약

앤스로픽(Anthropic)이 클로드(Claude) 플랫폼에 고성능 모델을 컨설턴트로, 경량 모델을 실무자로 활용하는 '어드바이저 전략(Advisor Strategy)'을 베타 버전으로 도입했습니다. 이 전략은 단일 API 요청 내에서 Opus가 어려운 결정에 대한 계획을 수립하면 Sonnet이나 Haiku가 이를 실행하게 하여, 비용은 낮추면서도 준수하는 수준의 지능을 에이전트에 부여합니다. 실제 평가에서 Opus의 자문을 받은 Sonnet은 단독 구동보다 높은 성능을 기록하면서도 작업 당 비용은 약 12% 절감하는 것으로 나타났습니다.

번역된 본문

클로드 플랫폼에 어드바이저 전략(Advisor Strategy)을 도입합니다.

Opus를 어드바이저(Advisor)로, Sonnet 또는 Haiku를 실행자(Executor)로 페어링하면, 에이전트가 작업 중 어려운 결정에 부딪혔을 때 Opus에 자문을 구할 수 있습니다. Opus가 실행 계획을 반환하면 실행자가 계속해서 작업을 진행하며, 이 모든 과정이 단일 API 요청 내에서 이루어집니다.

이를 통해 에이전트의 비용은 Sonnet 수준으로 유지하면서도 Opus에 준하는 수준의 지능을 구현할 수 있습니다.

저희 내부 평가에서 Opus 어드바이저와 함께한 Sonnet은 Sonnet 단독 모델보다 SWE-bench Multilingual(소프트웨어 엔지니어링 벤치마크 다국어)에서 2.7% 포인트 높은 점수를 기록했으며, 작업 당 비용은 11.9% 더 적게 들었습니다.

현재 클로드 플랫폼에서 베타 버전으로 사용할 수 있습니다.

자세한 내용 알아보기: https://claude.com/blog/the-advisor-strategy

원문 보기
원문 보기 (영어)
We're bringing the advisor strategy to the Claude Platform. Pair Opus as an advisor with Sonnet or Haiku as an executor, and your agents can consult Opus mid-task when they hit a hard decision. Opus returns a plan and the executor keeps running, all inside a single API request. This brings near Opus-level intelligence to your agents while keeping costs near Sonnet levels. In our evals, Sonnet with an Opus advisor scored 2.7 percentage points higher on SWE-bench Multilingual than Sonnet alone, while costing 11.9% less per task. Available now in beta on the Claude Platform. Learn more: https://claude.com/blog/the-advisor-strategy