메뉴
BL
The Decoder 19일 전

바이두 어니 5.1, 사전 학습 비용 94% 절감하며 최고 모델 경쟁

IMP
8/10
핵심 요약

바이두가 대형 언어 모델의 파라미터를 축소한 '어니 5.1'을 공개했습니다. 이 모델은 전 모델인 어니 5.0을 기반으로 '한 번으로 끝내는(Once-For-All) 탄력적 학습 프레임워크'를 적용해 사전 학습 비용을 94%나 절감했습니다. 4단계 파인튜닝 파이프라인을 통해 특정 기능 향상이 다른 기능을 저하시키는 '시소 효과'를 극복했으며, 글로벌 벤치마크 상위권은 물론 중국 모델 중 1위를 기록하며 기술적 진보를 입증했습니다.

번역된 본문

바이두가 대형 언어 모델의 파라미터를 축소한 '어니 5.1'을 공개했습니다. 이 모델은 전 모델인 어니 5.0을 기반으로 '한 번으로 끝내는(Once-For-All) 탄력적 학습 프레임워크'를 적용해 사전 학습 비용을 94%나 절감했습니다. 4단계 파인튜닝 파이프라인을 통해 특정 기능 향상이 다른 기능을 저하시키는 '시소 효과(Seesaw Effect)'를 극복했으며, 글로벌 벤치마크 상위권은 물론 중국 모델 중 1위를 기록하며 기술적 진보를 입증했습니다.

핵심 요약:

  • 바이두는 전 모델인 어니 5.0에서 추출(Distilled)하고 파라미터를 축소한 어니 5.1을 출시하여 자원 효율성을 높이는 동시에 중국 AI 벤치마크 1위를 차지했습니다.
  • 이 모델은 코드, 논리, 에이전트(Agent) 작업을 위한 전문가 모델(Specialized expert models)을 활용하는 4단계 학습 파이프라인(Pipeline)을 사용하여 학습 과정 중 각기 다른 능력이 서로 간섭하는 것을 방지하도록 설계되었습니다.
  • 어니 5.1은 바이두 플랫폼을 통해 접근 가능하고 다양한 크리에이티브 애플리케이션에 통합되었지만, 모델 가중치(Weights)는 비공개 폐쇄형으로 유지되어 독립적인 성능 검증은 불가능한 상태입니다.

바이두는 전신인 어니 5.0의 사전 학습(Pre-training) 기반 위에 구축되었으나, 총 파라미터는 약 3분의 1 수준이며 쿼리당 활성화되는 파라미터는 절반에 불과한 어니 5.1을 출시했습니다. 바이두에 따르면 사전 학습 비용은 동급 모델이 필요로 하는 비용의 단 6% 수준에 불과합니다. 5월 9일 기준 아레나 서치 리더보드(Arena Search Leaderboard)에서 어니 5.1은 1,223점을 획득하여 전 세계 4위, 중국 모델 중에서는 1위를 차지했습니다.

추가 벤치마크 테스트에서 바이두는 어니 5.1이 자율형 AI 에이전트 작업(tau3-bench, SpreadsheetBench-Verified)에서 DeepSeek-V4-Pro를 이겼으며, 지식 및 추론 벤치마크(GPQA, MMLU-Pro)에서는 구글의 Gemini 3.1 Pro에 근접한 성능을 보인다고 주장했습니다. 난이도 높은 수학 벤치마크(AIME26)에서는 도구 사용 권한을 부여했을 때 Gemini 3.1 Pro 바로 뒤를 이었습니다. 바이두는 내부 평가에서 이 모델이 서구의 상용 모델들과 창의적 글쓰기 분야에서도 맞먹는 성능을 보여준다고 덧붙였습니다.

더 작은 모델로 파생된 어니 5.1 바이두는 회사 측이 '한 번으로 끝내는(Once-For-All) 탄력적 학습 프레임워크'라고 부르는 방식을 사용하여 어니 5.0에서 더 작은 하위 모델로 어니 5.1을 구축했습니다. 각 모델 크기에 대해 별도의 비싼 사전 학습 과정을 거치는 대신, 단 한 번의 실행으로 다양한 크기의 모델 패밀리 전체를 최적화합니다. 이 모델들은 가중치를 공유하지만 깊이(Depth), 너비(Width), 그리고 특정 쿼리에 대해 활성화되는 전문가 블록(Expert blocks)의 수가 다릅니다. 바이두는 이 패밀리 중 가장 최적의 구성을 어니 5.1로 선택했으며, 어니 5.0에서 이미 막대한 컴퓨팅 작업이 완료되었기 때문에 사전 학습 비용이 낮게 측정된 것입니다.

또한 바이두는 강화 학습(Reinforcement learning) 인프라를 밑바닥부터 재구축했습니다. 핵심 구성 요소인 모델 업데이트, 응답 생성, 평가는 전통적으로 긴밀하게 결합되어 작동했습니다. 그러나 이제 바이두는 중앙 컨트롤러가 조정하는 독립적으로 확장되는 개별 하위 시스템(Subsystems)으로 이들을 분리하여 실행합니다. 각 구성 요소에 적합한 하드웨어를 할당하며, 한 단계의 병목 현상이 다른 단계를 방해하지 않는다고 회사는 설명했습니다.

대형 모델의 강화 학습에서 지속적인 문제는 서로 다른 컴퓨팅 설정으로 인해 학습과 예제 생성 사이에 발생하는 드리프트(Drift) 현상입니다. 이는 전체 과정을 불안정하게 만들 수 있습니다. 바이두는 표준화된 저정밀도(Low-precision) 연산 라이브러리와 함께 모델의 처리 속도를 눈에 띄게 저하시키지 않으면서 드리프트를 절반으로 줄여주는 혼합 전문가(MoE, Mixture-of-Experts) 모델용 보정 메커니즘을 적용해 이 문제를 해결합니다.

'시소 효과'를 해결하는 4단계 파이프라인 바이두는 잘 알려진 문제, 즉 여러 스킬을 한꺼번에 학습하면 한 영역의 향상이 다른 영역의 희생을 초래하는 문제를 해결하기 위해 4단계 파인튜닝(Fine-tuning) 과정을 사용합니다. 바이두는 이를 '시소 효과(Seesaw Effect)'라고 부릅니다. 즉, 코딩 능력, 논리력, 창의성이 서로를 끌어내리게 됩니다. 이 파이프라인은 광범위한 데이터셋에 대한 표준 지도 학습(Supervised training)으로 시작됩니다. 두 번째 단계에서는 코드, 추론, 에이전트 작업을 위해 각각 하나씩, 고유한 평가 신호(Evaluation signals)를 가진 여러 전문가 모델을 병렬로 학습시킵니다. 세 번째 단계에서는 단일 학생 모델(Student model)이 자체적으로 답변을 생성하여 전문가 모델의 출력과 비교함으로써 이 모든 교사 모델(Teachers)로부터 동시에 학습합니다. 마지막 단계에서는 일반적인 강화 학습(Reinforcement learning)을 추가하여 모델의 성능을 최종적으로 고도화합니다.

원문 보기
원문 보기 (영어)
Baidu's Ernie 5.1 cuts 94 percent of pre-training costs while competing with top models Jonathan Kemper View the LinkedIn Profile of Jonathan Kemper May 11, 2026 Midjourney prompted by THE DECODER Key Points Baidu has launched Ernie 5.1, a language model distilled from its larger predecessor Ernie 5.0, making it more resource-efficient while currently topping Chinese AI benchmarks. The model uses a four-stage training pipeline with specialized expert models for code, logic, and agent tasks, designed to prevent different capabilities from interfering with each other during the learning process. Ernie 5.1 is accessible through Baidu's platforms and integrated into various creative applications, but the model weights remain closed, making independent verification of its reported performance impossible. Ask about this article… Search Baidu has released Ernie 5.1, a language model built on the pre-training foundation of its predecessor Ernie 5.0 but with roughly a third of the total parameters and about half the active parameters per query. Pre-training costs came in at just six percent of what comparable models require, according to Baidu. On the Arena Search Leaderboard, Ernie 5.1 scored 1,223 points as of May 9—4th place globally and 1st among Chinese models. In additional benchmarks, Baidu claims Ernie 5.1 beats DeepSeek-V4-Pro on autonomous AI agent tasks (tau3-bench, SpreadsheetBench-Verified) and comes close to Google's Gemini 3.1 Pro on knowledge and reasoning benchmarks (GPQA, MMLU-Pro). On a tough math benchmark (AIME26), the model with tool access lands just behind Gemini 3.1 Pro. Internal evaluations also show the model matching Western commercial models in creative writing, Baidu says. Ad Ernie 5.1 is a smaller model based on its predecessor Baidu built Ernie 5.1 as a smaller sub-model from Ernie 5.0 using an approach the company calls the "Once-For-All elastic training framework." Instead of running a separate, expensive pre-training pass for each model size, the company optimizes an entire family of differently sized models in a single run. Ad DEC_D_Incontent-1 The models share weights but differ in depth, width, and how many specialized expert blocks activate for a given query. Baidu picked what it considers the best configuration from this family for Ernie 5.1, which explains the low pre-training costs, since the heavy compute was already done for Ernie 5.0. In addition, Baidu rebuilt its reinforcement learning infrastructure from the ground up. The key components—model updates, response generation, and evaluation—traditionally run tightly coupled. Baidu now runs them as separate subsystems that scale independently, coordinated by a central controller. Each component gets the right hardware, and a bottleneck in one step doesn't block the others, the company says. Ad A persistent challenge in large-model reinforcement learning is drift between training and example generation caused by different computation settings. This can destabilize the whole process. Baidu addresses it with a standardized low-precision computation library, plus a correction mechanism for mixture-of-experts models that cuts drift in half without noticeably slowing things down. A four-stage pipeline tackles the "seesaw effect" Baidu uses a four-stage fine-tuning process to address a well-known problem: training multiple skills at once often means gains in one area come at the cost of another. Baidu calls this the "seesaw effect:" coding ability, logic, and creativity end up dragging each other down. Ad DEC_D_Incontent-2 The pipeline starts with standard supervised training on a broad dataset. Stage two trains several specialized expert models in parallel, one each for code, reasoning, and agent tasks, each with its own evaluation signals. Ad In stage three, a single student model learns from all these teachers simultaneously by generating its own answers and comparing them against the experts' outputs. The final stage adds general reinforcement learning for open-ended dialog and creative tasks. Baidu says this step is necessary because teacher-student distillation tends to produce answers that are too polished and lack variety. Available on creative platforms, but no open weights Ernie 5.1 is available through ernie.baidu.com and a playground in Baidu AI Studio. The model will also roll out to more than ten creative platforms, including the role-playing platform Isekai Zero, creative agent Mulan AI, AI canvas app Diting Huanliu, and short drama generator Storymaster. As with Ernie 5.0, Baidu hasn't released model weights, so the benchmark scores and efficiency claims can't be independently verified. Baidu laid the groundwork for this leaner release with Ernie 5.0 in January 2026 . That model processes text, images, audio, and video in a unified architecture using a mixture-of-experts structure with roughly 2.4 trillion total parameters, fewer than three percent of which activate per query. AI News Without the Hype – Curated by Humans Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section. Subscribe now Source: Baidu