메타, 개인용 초지능 추론 모델 '뮤즈 스파크' 공개
메타 슈퍼인텔리전스 랩스(MSL)가 다중 모달 인식, 도구 사용, 에이전트 오케스트레이션을 지원하는 첫 번째 추론 모델인 '뮤즈 스파크(Muse Spark)'를 발표했습니다. 이 모델은 복잡한 문제를 병렬로 해결하는 'Contemplating(심층 사고) 모드'를 탑재하여 최첨단 AI 모델들과 경쟁할 수 있는 추론 성능을 보여줍니다. 또한 1,000명 이상의 의사와 협력하여 강화된 건강 관리 기능과 시각적 이해력을 갖추며 개인 맞춤형 초지능으로의 발돋움을 알렸습니다.
제품 AI 연구 최신 소식 Llama 체험하기 Meta AI 체험하기 주요 기사
뮤즈 스파크(Muse Spark) 소개: 개인용 초지능으로의 확장 2026년 4월 8일 • 15분 소요 읽기
오늘 저희는 Meta Superintelligence Labs(메타 슈퍼인텔리전스 랩스)에서 개발한 Muse(뮤즈) 모델 패밀리의 첫 번째 모델인 Muse Spark를 발표하게 되어 매우 기쁩니다. Muse Spark는 도구 사용(Tool-use), 시각적 사고 체인(Visual Chain of Thought), 및 다중 에이전트 오케스트레이션(Multi-agent Orchestration)을 지원하는 네이티브 다중 모달(Natively multimodal) 추론 모델입니다. Muse Spark는 저희의 확장 로드맵에서 첫 번째 단계이자, AI 개발 노력을 근본적으로 전면 개편한 결과물입니다. 향후 확장을 지원하기 위해 저희는 연구 및 모델 학습부터 Hyperion 데이터 센터를 포함한 인프라에 이르기까지 전체 스택에 걸쳐 전략적인 투자를 진행하고 있습니다.
이 글에서는 먼저 Muse Spark의 새로운 기능과 응용 프로그램을 살펴보겠습니다. 이러한 결과를 확인한 후, 개인용 초지능을 향한 저희의 발전을 이끄는 확장 축(Scaling Axes)의 이면을 살펴보겠습니다. Muse Spark는 오늘 meta.ai와 Meta AI 앱에서 사용할 수 있습니다. 또한 선정된 사용자를 대상으로 비공개 API 프리뷰를 시작합니다.
개인용 초지능을 위한 기능 Muse Spark는 다중 모달 인식, 추론, 건강 및 에이전트(Agentic) 작업에서 경쟁력 있는 성능을 제공합니다. 장기적인 에이전트 시스템 및 코딩 워크플로우와 같이 현재 성능 격차가 있는 분야에 대해 저희는 계속해서 투자하고 있습니다. 더 큰 모델이 개발 중이며, 이러한 결과는 저희의 스택이 효과적으로 확장되고 있음을 보여줍니다.
또한 병렬로 추론하는 여러 에이전트를 조정하는 'Contemplating 모드(심층 사고 모드)'를 출시합니다. 이를 통해 Muse Spark는 Gemini Deep Think 및 GPT Pro와 같은 최첨단 모델의 극단적인 추론 모드와 경쟁할 수 있습니다. Contemplating 모드는 까다로운 작업에서 상당한 기능 향상을 제공하여 'Humanity's Last Exam(인류의 마지막 시험)'에서 58%, 'FrontierScience Research(프론티어 사이언스 리서치)'에서 38%를 달성했습니다. Muse Spark는 현재 사용 가능하며, Contemplating 모드는 meta.ai에서 점진적으로 도입될 예정입니다.
평가에 대한 자세한 내용은 방법론 문서를 참조하십시오.
응용 프로그램 Muse Spark는 사용자의 세계를 이해하는 개인용 초지능을 향한 첫 걸음입니다. 즉각적인 환경 분석부터 웰빙 지원까지, Muse Spark의 고급 추론 기능은 강력하고 매우 개인화된 사용 사례를 가능하게 합니다.
멀티모달(Multimodal). Muse Spark는 다양한 도메인과 도구에 걸쳐 시각적 정보를 통합하도록 처음부터 설계되었습니다. 시각적 STEM(이공계열) 질문, 엔티티 인식 및 위치 추적에서 탁월한 성능을 발휘합니다. 이러한 기능은 재미있는 미니 게임을 만들거나 동적 주석을 통해 가전 제품의 문제를 해결하는 것과 같은 대화형 경험을 가능하게 합니다.
건강(Health). 개인용 초지능의 주요 응용 분야 중 하나는 사람들이 자신의 건강에 대해 알아보고 개선하도록 돕는 것입니다. Muse Spark의 건강 추론 기능을 향상시키기 위해 1,000명 이상의 의사와 협력하여 보다 사실적이고 포괄적인 응답을 가능하게 하는 학습 데이터를 큐레이션했습니다. Muse Spark는 다양한 음식의 영양 성분이나 운동 중 활성화되는 근육과 같은 건강 정보를 분석하고 설명하는 대화형 디스플레이를 생성할 수 있습니다.
확장 축(Scaling Axes) 개인용 초지능을 구축하려면 모델의 기능을 예측 가능하고 효율적으로 확장할 수 있어야 합니다. 아래에서는 사전 학습(Pretraining), 강화 학습(Reinforcement Learning), 테스트 시간 추론(Test-time Reasoning)이라는 세 가지 축을 따라 Muse Spark의 확장 속성을 연구하고 추적하는 방법을 공유합니다.
사전 학습(Pretraining). 사전 학습 단계는 Muse Spark가 핵심 다중 모달 이해, 추론 및 코딩 능력을 습득하는 단계로, 강화 학습과 테스트 시간 컴퓨팅이 구축되는 기반입니다. 지난 9개월 동안 모델 아키텍처, 최적화 및 데이터 큐레이션을 개선하여 사전 학습 스택을 재구축했습니다. 이러한 발전을 함께 결합하면 모든 컴퓨팅 단위에서 추출할 수 있는 성능이 향상됩니다. 새로운 레시피를 엄격하게 평가하기 위해 일련의 소규모 모델에 확장 법칙(Scaling Law)을 적용하고 특정 수준의 성능에 도달하는 데 필요한 학습 FLOPs를 비교했습니다. 그 결과는 명확합니다: 저희는 [원문 여기서 끊김]