메뉴
BL
MarkTechPost 2일 전

헥소 랩스, 모델 가중치와 구조 모두를 업데이트하는 자가 개선 에이전트 'SIA' 오픈소스화

IMP
8/10
핵심 요약

Hexo Labs가 MIT 라이선스로 자가 개선 루프 시스템인 SIA를 오픈소스로 공개했습니다. 이 에이전트는 실행 기록을 분석해 스캐폴드 코드(Scaffold)를 재작성하거나 모델의 LoRA 가중치를 업데이트하여 성능을 지속적으로 향상시킵니다. 두 가지 방식을 결합한 결과, 벤치마크 테스트에서 기존 방식 대비 월등한 성능 개선을 입증했다는 점이 핵심입니다.

번역된 본문

Hexo Labs는 MIT 라이선스에 따라 오픈소스 자가 개선 루프(self-improving loop)인 SIA를 공개했습니다. 이 시스템의 피드백 에이전트(Feedback-Agent)는 각 실행 궤적(trajectory)을 읽고, 스캐폴드(scaffold)를 재작성하거나 gpt-oss-120b 모델에 대한 LoRA 가중치 업데이트를 트리거합니다. 이 두 가지 요소를 결합한 방식은 LawBench, TriMul GPU 커널, scRNA-seq 노이즈 제거(denoising) 벤치마크에서 스캐폴드만 반복적으로 수정했던 기존 방식을 능가하는 성능을 보여주었습니다.

'헥소 랩스, 모델 가중치와 구조 모두를 업데이트하는 자가 개선 에이전트 SIA 오픈소스화'라는 제목의 이 글은 MarkTechPost에 처음 게재되었습니다.

원문 보기
원문 보기 (영어)
Hexo Labs released SIA, an open-source self-improving loop, under an MIT license. A Feedback-Agent reads each run's trajectory, then either rewrites the scaffold or triggers a LoRA weight update on gpt-oss-120b. Combining both levers beat scaffold-only iteration on LawBench, TriMul GPU kernels, and scRNA-seq denoising. The post Hexo Labs Open-Sources SIA: A Self-Improving Agent That Updates Both the Harness and the Model Weights appeared first on MarkTechPost.