메뉴
BL
VentureBeat AI 143일 전

Nous Research, 오픈소스 코딩 모델 NousCoder-14B 공개

IMP
8/10
핵심 요약

Nous Research가 단 4일 만에 학습한 오픈소스 코딩 모델 'NousCoder-14B'를 공개했습니다. 이 모델는 더 큰 규모의 상용 모델들에 필적하는 성능을 보여주며, Anthropic의 'Claude Code'가 장악한 AI 코딩 시장에서 강력한 오픈소스 대안으로 떠오르고 있습니다. 특히 모델 가중치뿐만 아니라 강화 학습 환경과 학습 도구까지 완벽하게 공개하여 연구 및 재현 가능성을 극대화한 점이 핵심입니다.

번역된 본문

암호화폐 벤처 펌인 패러다임(Paradigm)의 지원을 받는 오픈소스 인공지능 스타트업 Nous Research(누스 리서치)가 월요일에 새로운 경쟁적 프로그래밍 모델을 발표했습니다. 이 모델은 여러 대형 상용 시스템과 동등하거나 이를 능가하는 성능을 발휘하며, 엔비디아의 최신 B200 그래픽 프로세서(GPU) 48개를 사용해 단 4일 만에 학습되었습니다.

'NousCoder-14B'라는 이름의 이 모델은 경쟁이 치열한 AI 코딩 어시스턴트 시장의 또 다른 주자입니다. 하지만 이 모델은 특히 민감한 시기에 등장했습니다. 경쟁사 Anthropic(앤스로픽)의 에이전트형 프로그래밍 도구인 Claude Code(클로드 코드)는 새해 첫날 이후 소셜 미디어를 뜨겁게 달궜으며, 개발자들은 그 능력에 대해 놀라움을 금치 못하는 반응들을 쏟아내고 있습니다. 이러한 동시다발적인 움직임은 AI 지원 소프트웨어 개발이 얼마나 빠르게 진화하고 있는지, 그리고 소프트웨어 작성의 기초 기술이 될 것으로 믿어지는 시장을 차지하기 위해 대기업과 중소기업이 얼마나 치열하게 경쟁하고 있는지를 잘 보여줍니다.

NousCoder-14B는 2024년 8월부터 2025년 5월 사이에 출제된 경쟁 프로그래밍 문제로 모델을 평가하는 표준 벤치마크인 LiveCodeBench v6에서 67.87%의 정확도를 달성했습니다. 이번 릴리스와 함께 발표된 Nous Research의 기술 보고서에 따르면, 이 수치는 베이스 모델로 사용된 알리바바의 Qwen3-14B 대비 7.08%p 향상된 수치입니다.

구글에서 Gemini API를 담당하는 수석 엔지니어인 자나 도간(Jaana Dogan)은 지난주 X(옛 트위터)에 게시된 화제의 글을 통해 AI 코딩 도구에 대한 현재의 분위기를 이렇게 요약했습니다. "Claude Code에 문제 설명을 입력했더니, 작년에 우리가 구축하는 데 1년이 걸렸던 시스템을 단 1시간 만에 만들어냈습니다." 도간은 그녀의 팀이 분산형 에이전트 오케스트레이션 시스템을 개발하는 데 1년을 보냈으며, Claude Code가 단 세 문단의 프롬프트만으로 그와 비슷한 수준의 시스템을 만들어냈다고 설명했습니다.

이러한 대조는 시사하는 바가 큽니다. Anthropic의 Claude Code가 엔드투엔드 소프트웨어 개발 시연으로 대중의 상상력을 사로잡고 있는 가운데, Nous Research는 검증 가능한 문제로 학습된 오픈소스 대안을 통해 이 격차를 좁힐 수 있다고, 그리고 모델의 순수한 성능만큼이나 모델이 어떻게 구축되었는지에 대한 투명성이 중요하다고 베팅하고 있습니다.

누구나 복제할 수 있는 AI 코딩 모델을 만든 방법

NousCoder-14B의 발표가 다른 경쟁사들과 차별화되는 점은 바로 급진적인 '개방성'에 있습니다. Nous Research는 모델 가중치뿐만 아니라 회사의 Atropos(아트로포스) 프레임워크를 기반으로 구축된 완전한 강화 학습 환경, 벤치마크 스위트, 학습 하네스(Training Harness)를 공개했습니다. 이를 통해 충분한 컴퓨팅 자원을 가진 모든 연구자가 이 작업을 재현하거나 확장할 수 있습니다.

한 관찰자는 X(옛 트위터)에서 "Atropos 스택의 오픈소스화는 재현 가능한 올림피아드 수준의 추론 연구에 필요한 인프라를 제공한다"고 언급하며 이번 발표가 학계 및 오픈소스 커뮤니티에 미치는 중요성을 요약했습니다.

이 모델은 Nous Research의 상주 연구원이자 전직 경쟁 프로그래머인 Joe Li(조 리)가 학습시켰습니다. Li의 기술 보고서는 모델의 성능 향상을 비교한 예상치 못한 개인적인 차원의 내용을 담고 있습니다.

원문 보기
원문 보기 (영어)
Nous Research, the open-source artificial intelligence startup backed by crypto venture firm Paradigm, released a new competitive programming model on Monday that it says matches or exceeds several larger proprietary systems — trained in just four days using 48 of Nvidia's latest B200 graphics processors.The model, called NousCoder-14B, is another entry in a crowded field of AI coding assistants, but arrives at a particularly charged moment: Claude Code, the agentic programming tool from rival Anthropic, has dominated social media discussion since New Year's Day, with developers posting breathless testimonials about its capabilities. The simultaneous developments underscore how quickly AI-assisted software development is evolving — and how fiercely companies large and small are competing to capture what many believe will become a foundational technology for how software gets written.type: embedded-entry-inline id: 74cSyrq6OUrp9SEQ5zOUSlNousCoder-14B achieves a 67.87 percent accuracy rate on LiveCodeBench v6, a standardized evaluation that tests models on competitive programming problems published between August 2024 and May 2025. That figure represents a 7.08 percentage point improvement over the base model it was trained from, Alibaba's Qwen3-14B, according to Nous Research's technical report published alongside the release."I gave Claude Code a description of the problem, it generated what we built last year in an hour," wrote Jaana Dogan, a principal engineer at Google responsible for the Gemini API, in a viral post on X last week that captured the prevailing mood around AI coding tools. Dogan was describing a distributed agent orchestration system her team had spent a year developing — a system Claude Code approximated from a three-paragraph prompt.The juxtaposition is instructive: while Anthropic's Claude Code has captured imaginations with demonstrations of end-to-end software development, Nous Research is betting that open-source alternatives trained on verifiable problems can close the gap — and that transparency in how these models are built matters as much as raw capability.How Nous Research built an AI coding model that anyone can replicateWhat distinguishes the NousCoder-14B release from many competitor announcements is its radical openness. Nous Research published not just the model weights but the complete reinforcement learning environment, benchmark suite, and training harness — built on the company's Atropos framework — enabling any researcher with sufficient compute to reproduce or extend the work."Open-sourcing the Atropos stack provides the necessary infrastructure for reproducible olympiad-level reasoning research," noted one observer on X, summarizing the significance for the academic and open-source communities.The model was trained by Joe Li, a researcher in residence at Nous Research and a former competitive programmer himself. Li's technical report reveals an unexpectedly personal dimension: he compared the model's impro