메뉴

#API 비용 절감

HN
Hacker News 34일 전
IMP 8

오픈소스 에이전트 Dirac, TerminalBench 1위 달성

오픈소스 코딩 에이전트인 Dirac이 gemini-3-flash-preview 모델 기준 TerminalBench-2 리더보드에서 65.2%의 점수로 1위를 차지했습니다. 이 에이전트는 문맥 길이가 길어질 때 발생하는 추론 능력 저하 문제를 해결하기 위해 컨텍스트를 최적화하고, AST(추상 구문 트리) 조작 및 해시 기반 편집을 활용합니다. 그 결과 경쟁 모델 대비 64.8% 낮은 비용으로 더 빠르고 정확한 코딩 작업을 수행할 수 있음을 입증했습니다.

오픈소스 코딩 에이전트 TerminalBench