메뉴
BL
MarkTechPost 28일 전

미스트랄, 코딩 에이전트 '바이브' 원격 기능 및 128B 신모델 공개

IMP
8/10
핵심 요약

미스트랄 AI가 오픈소스 기반 코딩 에이전트 플랫폼인 '바이브(Vibe)'에서 장시간 작업이 가능한 '원격 에이전트' 기능을 출시했습니다. 이와 함께 SWE-Bench 검증 스코어 77.6%를 달성한 128B 파라미터의 멀티모달 밀집 모델인 '미스트랄 미디엄 3.5(Mistral Medium 3.5)'를 공개하여 기본 모델로 적용했습니다. 이번 업데이트로 개발자는 더 이상 로컬 환경에 얽매이지 않고 클라우드에서 안정적으로 코딩 에이전트를 구동하고 병렬 작업을 수행할 수 있게 되었습니다.

번역된 본문

[에디터 추천] 에이전트 AI, 인공지능, AI 인프라 기술, AI 쇼츠, 애플리케이션, 언어 모델, 대형 언어 모델(LLM), 머신러닝, 신제품, 오픈소스, 소프트웨어 엔지니어링, 스태프, 기술 뉴스, 바이브 코딩

미스트랄 AI(Mistral AI)는 오픈소스/오픈 웨이트 AI 분야에서 가장 실용적인 코딩 에이전트 생태계를 조용히 구축해 왔으며, 이번에 그동안 가장 중대한 인프라 업그레이드를 선보입니다.

미스트랄 팀은 코딩 에이전트 플랫폼인 '바이브(Vibe)'에 원격 에이전트를 도입함과 동시에, 미스트랄의 소비자용 AI 비서인 '르 샤(Le Chat)'와 바이브 모두에서 기본 모델로 사용되는 새로운 128B 밀집(dense) 모델인 '미스트랄 미디엄 3.5(Mistral Medium 3.5)'의 퍼블릭 프리뷰를 발표했습니다.

바이브(Vibe)란 무엇이며, 왜 중요할까요? 아직 사용해 보지 않으셨다면 소개해 드리겠습니다. 미스트랄의 '바이브'는 CLI(명령줄 인터페이스)를 통해 접근할 수 있는 코딩 에이전트로, AI 모델이 사용자를 대신해 소프트웨어 작업을 수행하도록 도와줍니다. 코드 작성, 모듈 리팩토링, 테스트 생성, CI(지속적 통합) 오류 원인 파악 등의 작업이 가능합니다. 지치지 않고 전체 코드베이스에서 작업할 수 있는 주니어 개발자가 생긴다고 생각하시면 됩니다.

지금까지는 바이브 세션이 로컬에서 실행되었기 때문에, 에이전트가 사용자의 노트북과 터미널 환경에 종속되었습니다. 하지만 오늘 이 한계가 깨졌습니다.

원격 에이전트(Remote Agents): 자리를 비운 사이에도 에이전트가 작동합니다 이제 코딩 세션은 사용자가 자리를 비운 사이에도 긴 시간이 걸리는 작업을 처리할 수 있습니다. 여러 세션을 병렬로 실행할 수 있으며, 사용자가 더 이상 에이전트의 모든 단계에서 병목 구간이 되지 않아도 됩니다. 이것이 핵심적인 행동 변화입니다. 터미널에서 코딩 세션을 하염없이 지켜보는 대신, 작업을 시작하고 클라우드가 나머지를 알아서 처리하도록 맡길 수 있습니다.

미스트랄 바이브 CLI나 르 샤(Le Chat)에서 클라우드 에이전트를 시작할 수 있습니다. 에이전트가 실행되는 동안 파일 변경 사항(diff), 도구 호출, 진행 상태 및 질문 등이 실시간으로 표시되어 에이전트가 현재 무엇을 하고 있는지 확인할 수 있습니다.

이미 로컬에서 세션을 진행 중인 개발자에게 특히 유용한 기능이 있습니다. 작업을 계속 실행 상태로 두고 싶을 때, 진행 중인 로컬 CLI 세션을 클라우드로 '순간이동(Teleport)'시킬 수 있습니다. 세션 기록, 작업 상태 및 승인 정보가 그대로 유지됩니다. 따라서 작업 상태를 잃지 않고 그저 컴퓨터에서 작업을 옮기기만 하면 됩니다.

각 세션은 격리되어 실행됩니다. 모든 코딩 세션은 대규모 편집 및 설치를 포함하여 격리된 샌드박스 환경에서 실행됩니다. 작업이 완료되면 에이전트가 GitHub에서 풀 리퀘스트(Pull Request)를 생성하고 사용자에게 알림을 보냅니다. 이를 통해 개발자는 에이전트가 친 모든 키 입력 과정이 아닌, 최종 결과물만 검토하면 됩니다.

또한 바이브가 르 샤(Le Chat)와 어떻게 연결되는지 그 이면의 논리를 이해하는 것도 가치가 있습니다. 미스트랄은 미스트랄 스튜디오(Mistral Studio)에서 오케스트레이션(조율)된 '워크플로우'를 사용하여 바이브를 르 샤에 통합했습니다. 이 시스템은 원래 자사 내부 코딩 환경을 위해 구축되었고, 이후 엔터프라이즈 고객을 거쳐 이제는 모든 사람에게 공개되었습니다. 즉, 르 샤의 원격 코딩 에이전트는 단독으로 떨어져 나온 기능이 아니라 미스트랄 자체적인 오케스트레이션 계층 위에 구축된 것입니다. 이는 유사한 에이전트 시스템을 직접 아키텍처하려는 개발자들에게 매우 유용한 참고 자료가 될 것입니다.

통합 측면에서 바이브는 코드 및 풀 리퀘스트 관리를 위해 GitHub과 연동되고, 이슈 트래킹을 위해 Linear 및 Jira, 인시던트 관리를 위해 Sentry, 그리고 보고를 위해 Slack이나 Teams 같은 앱과 연결됩니다.

미스트랄 미디엄 3.5 (Mistral Medium 3.5): 이 모든 것을 뒷받침하는 모델 이 모든 것이 실제로 가능하려면 뛰어난 성능의 기반 AI 모델이 필수적입니다. 새롭게 공개된 모델인 '미스트랄 미디엄 3.5'는 미스트랄 팀이 자사 최초의 플래그십 병합 모델(merged model)로 설명하는 모델입니다.

이 모델은 256k 컨텍스트 윈도우를 갖춘 128B 밀집(dense) 모델로, 단일 가중치 세트만으로도 지시 사항 준수(instruction-following), 추론(reasoning) 및 코딩을 모두 처리할 수 있습니다. 참고로 256k 컨텍스트 윈도우는 모델이 한 번에 약 20만 단어를 처리할 수 있음을 의미하며, 이는 전체 대규모 코드베이스를 아우르며 추론하기에 충분히 긴 길이입니다.

또한 이 모델은 멀티모odal입니다. 미스트랄 팀은 가변적인 이미지 크기와 가로세로 비율을 처리하기 위해 비전 인코더(vision encoder)를 처음부터 새롭게 학습시켰습니다. 이는 주목할 만한 아키텍처 선택입니다. 대부분의 비전-언어 모델은 CLIP과 같은 사전 학습된 인코더를 재사용하는 반면, 이 구성 요소를 밑바닥부터 구축했다는 것은 미스트랄이 고정된 해상도 설정에 기본값을 두는 대신, 실제 이미지 입력을 처리하는 방식의 유연성을 우선시했음을 시사합니다.

미스트랄 미디엄 3.5는 77.6%의 스코어를 기록했습니다.

원문 보기
원문 보기 (영어)
Editors Pick Agentic AI Artificial Intelligence AI Infrastructure Technology AI Shorts Applications Language Model Large Language Model Machine Learning New Releases Open Source Software Engineering Staff Tech News Vibe Coding Mistral AI has been quietly building one of the more practical coding agent ecosystems in the open-source/weights AI space, and they are shipping its most significant infrastructure upgrade yet. Mistral team announced remote agents in Vibe , its coding agent platform, alongside the public preview of Mistral Medium 3.5 — a new 128B dense model that now serves as the default model in both Vibe and Le Chat, Mistral's consumer assistant. What is Vibe, and Why Does It Matter? If you haven't used it yet, Mistral Vibe is a coding agent accessible through a CLI (command-line interface) that lets an AI model work through software tasks on your behalf — writing code, refactoring modules, generating tests, investigating CI failures, and more. Think of it as a junior developer that never gets tired and can operate across your codebase. Until now, Vibe sessions ran locally, meaning the agent was tied to your laptop and your terminal. That changes today. Remote Agents: The Agent Runs While You Step Away So, basically now coding sessions can work through long tasks while you're away. Many can run in parallel, and you stop being the bottleneck on every step the agent takes. This is the key behavioral shift. Instead of babysitting a coding session in your terminal, you kick off a task and let the cloud handle the rest. You can start cloud agents from the Mistral Vibe CLI or from Le Chat. While they run, you can inspect what the agent is doing, with file diffs, tool calls, progress states, and questions surfaced as you go. One particularly useful feature for developers already mid-session: ongoing local CLI sessions can be teleported up to the cloud when you want to leave them running, with session history, task state, and approvals carrying across. So you don't lose your place — you just move the work off your machine. Each session runs in isolation. Each coding session runs in an isolated sandbox, including broad edits and installs. When the work is done, the agent can open a pull request on GitHub and notify you, so you review the result instead of every keystroke that produced it. It's also worth understanding the logic behind how Vibe connects to Le Chat. Mistral uses Workflows orchestrated in Mistral Studio to bring Mistral Vibe into Le Chat — originally built for their own in-house coding environment, then for enterprise customers, and now open to everyone. This means the remote coding agent in Le Chat is not a standalone feature — it's built on top of Mistral's own orchestration layer, which is useful context if you're thinking about how to architect similar agentic systems yourself. On the integration side, Vibe plugs into GitHub for code and pull requests, Linear and Jira for issues, Sentry for incidents, and apps like Slack or Teams for reporting. Mistral Medium 3.5: The Model Behind It All None of this would be practically possible without a capable underlying AI model. This new released model is Mistral Medium 3.5 , which Mistral team describes as its first flagship merged model. It is a dense 128B model with a 256k context window, handling instruction-following, reasoning, and coding in a single set of weights. For context, a 256k context window means the model can process roughly 200,000 words in a single pass — long enough to reason across an entire large codebase. The model is also multimodal. Mistral team trained the vision encoder from scratch to handle variable image sizes and aspect ratios — a notable architectural choice. Most vision-language models reuse pretrained encoders like CLIP, so building this component from scratch suggests Mistral prioritized flexibility in how the model handles real-world image inputs rather than defaulting to fixed-resolution assumptions. Mistral Medium 3.5 scores 77.6% on SWE-Bench Verified, ahead of Devstral 2 and models like Qwen3.5 397B A17B. SWE-Bench Verified is a standard benchmark that tests whether a model can resolve real-world GitHub issues from popular open-source repositories — it's one of the most reliable proxies for practical software engineering ability. The model also scores 91.4 on τ³-Telecom and has strong agentic capabilities. One particularly interesting design choice: reasoning effort is now configurable per request, so the same model can answer a quick chat reply or work through a complex agentic run. This is important for developers integrating the model via API — you can dial down compute for simple lookups and dial it up for multi-step reasoning tasks, without switching models. The model was built for long-horizon tasks, calling multiple tools reliably, and producing structured output that downstream code can consume. Work Mode in Le Chat: A New Agentic Layer Beyond the coding agent upgrades, Mistral is also shipping Work mode in Le Chat — a new agentic mode for more general, multi-step tasks. Work mode is a powerful new agentic mode for complex tasks in Le Chat, powered by a new harness and Mistral Medium 3.5. The agent becomes the execution backend for the assistant itself, so Le Chat can read and write, use several tools at once, and work through multi-step projects until it completes what you've asked. Practically, this means things like cross-tool workflows — catching up across email, messages, and calendar; preparing for a meeting with relevant context pulled from multiple sources; or triaging an inbox and creating Jira issues from team discussions. In Work mode, connectors are on by default rather than chosen manually, which lets the agent reach into documents, mailboxes, calendars, and other systems for the rich context it needs to take correct action. This is a significant usability shift from typical chat assistants, where you manually select tools before each session. Transparency is a built-in feature rather than an afterthought: every action the agent takes is visible — you see each tool call and the thinking rationale. Le Chat will ask for explicit approval — based on your permissions — before proceeding with sensitive tasks like sending a message, writing a document, or modifying data. Key Takeaways Here are the key takeaways: Mistral Medium 3.5 is now the default model in both Vibe and Le Chat — a dense 128B model with a 256k context window that scores 77.6% on SWE-Bench Verified, beats Devstral 2 and Qwen3.5 397B A17B, and is available as open weights on Hugging Face. Vibe coding agents now run in the cloud — sessions can be spawned from the CLI or Le Chat, run asynchronously in isolated sandboxes, and local sessions can be teleported to the cloud without losing session history or task state. Le Chat's new Work mode brings parallel, multi-step agentic task execution — powered by Mistral Medium 3.5, it can work across email, calendar, documents, Jira, and Slack simultaneously, with all tool calls and reasoning steps visible and explicit approval required before sensitive actions. Reasoning effort in Mistral Medium 3.5 is configurable per API request — the same model handles lightweight chat replies and complex long-horizon agentic runs. Check out the Model Weights on HF and Technical details . Also, feel free to follow us on Twitter and don’t forget to join our 130k+ ML SubReddit and Subscribe to our Newsletter . Wait! are you on telegram? now you can join us on telegram as well. Need to partner with us for promoting your GitHub Repo OR Hugging Face Page OR Product Release OR Webinar etc.? Connect with us