미스트랄, 코딩 에이전트 '바이브' 원격 기능 및 128B 신모델 공개
미스트랄 AI가 오픈소스 기반 코딩 에이전트 플랫폼인 '바이브(Vibe)'에서 장시간 작업이 가능한 '원격 에이전트' 기능을 출시했습니다. 이와 함께 SWE-Bench 검증 스코어 77.6%를 달성한 128B 파라미터의 멀티모달 밀집 모델인 '미스트랄 미디엄 3.5(Mistral Medium 3.5)'를 공개하여 기본 모델로 적용했습니다. 이번 업데이트로 개발자는 더 이상 로컬 환경에 얽매이지 않고 클라우드에서 안정적으로 코딩 에이전트를 구동하고 병렬 작업을 수행할 수 있게 되었습니다.
[에디터 추천] 에이전트 AI, 인공지능, AI 인프라 기술, AI 쇼츠, 애플리케이션, 언어 모델, 대형 언어 모델(LLM), 머신러닝, 신제품, 오픈소스, 소프트웨어 엔지니어링, 스태프, 기술 뉴스, 바이브 코딩
미스트랄 AI(Mistral AI)는 오픈소스/오픈 웨이트 AI 분야에서 가장 실용적인 코딩 에이전트 생태계를 조용히 구축해 왔으며, 이번에 그동안 가장 중대한 인프라 업그레이드를 선보입니다.
미스트랄 팀은 코딩 에이전트 플랫폼인 '바이브(Vibe)'에 원격 에이전트를 도입함과 동시에, 미스트랄의 소비자용 AI 비서인 '르 샤(Le Chat)'와 바이브 모두에서 기본 모델로 사용되는 새로운 128B 밀집(dense) 모델인 '미스트랄 미디엄 3.5(Mistral Medium 3.5)'의 퍼블릭 프리뷰를 발표했습니다.
바이브(Vibe)란 무엇이며, 왜 중요할까요? 아직 사용해 보지 않으셨다면 소개해 드리겠습니다. 미스트랄의 '바이브'는 CLI(명령줄 인터페이스)를 통해 접근할 수 있는 코딩 에이전트로, AI 모델이 사용자를 대신해 소프트웨어 작업을 수행하도록 도와줍니다. 코드 작성, 모듈 리팩토링, 테스트 생성, CI(지속적 통합) 오류 원인 파악 등의 작업이 가능합니다. 지치지 않고 전체 코드베이스에서 작업할 수 있는 주니어 개발자가 생긴다고 생각하시면 됩니다.
지금까지는 바이브 세션이 로컬에서 실행되었기 때문에, 에이전트가 사용자의 노트북과 터미널 환경에 종속되었습니다. 하지만 오늘 이 한계가 깨졌습니다.
원격 에이전트(Remote Agents): 자리를 비운 사이에도 에이전트가 작동합니다 이제 코딩 세션은 사용자가 자리를 비운 사이에도 긴 시간이 걸리는 작업을 처리할 수 있습니다. 여러 세션을 병렬로 실행할 수 있으며, 사용자가 더 이상 에이전트의 모든 단계에서 병목 구간이 되지 않아도 됩니다. 이것이 핵심적인 행동 변화입니다. 터미널에서 코딩 세션을 하염없이 지켜보는 대신, 작업을 시작하고 클라우드가 나머지를 알아서 처리하도록 맡길 수 있습니다.
미스트랄 바이브 CLI나 르 샤(Le Chat)에서 클라우드 에이전트를 시작할 수 있습니다. 에이전트가 실행되는 동안 파일 변경 사항(diff), 도구 호출, 진행 상태 및 질문 등이 실시간으로 표시되어 에이전트가 현재 무엇을 하고 있는지 확인할 수 있습니다.
이미 로컬에서 세션을 진행 중인 개발자에게 특히 유용한 기능이 있습니다. 작업을 계속 실행 상태로 두고 싶을 때, 진행 중인 로컬 CLI 세션을 클라우드로 '순간이동(Teleport)'시킬 수 있습니다. 세션 기록, 작업 상태 및 승인 정보가 그대로 유지됩니다. 따라서 작업 상태를 잃지 않고 그저 컴퓨터에서 작업을 옮기기만 하면 됩니다.
각 세션은 격리되어 실행됩니다. 모든 코딩 세션은 대규모 편집 및 설치를 포함하여 격리된 샌드박스 환경에서 실행됩니다. 작업이 완료되면 에이전트가 GitHub에서 풀 리퀘스트(Pull Request)를 생성하고 사용자에게 알림을 보냅니다. 이를 통해 개발자는 에이전트가 친 모든 키 입력 과정이 아닌, 최종 결과물만 검토하면 됩니다.
또한 바이브가 르 샤(Le Chat)와 어떻게 연결되는지 그 이면의 논리를 이해하는 것도 가치가 있습니다. 미스트랄은 미스트랄 스튜디오(Mistral Studio)에서 오케스트레이션(조율)된 '워크플로우'를 사용하여 바이브를 르 샤에 통합했습니다. 이 시스템은 원래 자사 내부 코딩 환경을 위해 구축되었고, 이후 엔터프라이즈 고객을 거쳐 이제는 모든 사람에게 공개되었습니다. 즉, 르 샤의 원격 코딩 에이전트는 단독으로 떨어져 나온 기능이 아니라 미스트랄 자체적인 오케스트레이션 계층 위에 구축된 것입니다. 이는 유사한 에이전트 시스템을 직접 아키텍처하려는 개발자들에게 매우 유용한 참고 자료가 될 것입니다.
통합 측면에서 바이브는 코드 및 풀 리퀘스트 관리를 위해 GitHub과 연동되고, 이슈 트래킹을 위해 Linear 및 Jira, 인시던트 관리를 위해 Sentry, 그리고 보고를 위해 Slack이나 Teams 같은 앱과 연결됩니다.
미스트랄 미디엄 3.5 (Mistral Medium 3.5): 이 모든 것을 뒷받침하는 모델 이 모든 것이 실제로 가능하려면 뛰어난 성능의 기반 AI 모델이 필수적입니다. 새롭게 공개된 모델인 '미스트랄 미디엄 3.5'는 미스트랄 팀이 자사 최초의 플래그십 병합 모델(merged model)로 설명하는 모델입니다.
이 모델은 256k 컨텍스트 윈도우를 갖춘 128B 밀집(dense) 모델로, 단일 가중치 세트만으로도 지시 사항 준수(instruction-following), 추론(reasoning) 및 코딩을 모두 처리할 수 있습니다. 참고로 256k 컨텍스트 윈도우는 모델이 한 번에 약 20만 단어를 처리할 수 있음을 의미하며, 이는 전체 대규모 코드베이스를 아우르며 추론하기에 충분히 긴 길이입니다.
또한 이 모델은 멀티모odal입니다. 미스트랄 팀은 가변적인 이미지 크기와 가로세로 비율을 처리하기 위해 비전 인코더(vision encoder)를 처음부터 새롭게 학습시켰습니다. 이는 주목할 만한 아키텍처 선택입니다. 대부분의 비전-언어 모델은 CLIP과 같은 사전 학습된 인코더를 재사용하는 반면, 이 구성 요소를 밑바닥부터 구축했다는 것은 미스트랄이 고정된 해상도 설정에 기본값을 두는 대신, 실제 이미지 입력을 처리하는 방식의 유연성을 우선시했음을 시사합니다.
미스트랄 미디엄 3.5는 77.6%의 스코어를 기록했습니다.