메뉴
BL
r/LocalLLaMA 44일 전

알리바바 '큐웬3.6-35B-A3B' 오픈소스 공개

IMP
8/10
핵심 요약

알리바바가 총 350억(35B) 파라미터 규모에 실제 활성 파라미터는 30억(3B)에 불과한 희소 MoE(Sparse MoE) 기반의 초경량 모델 '큐원3.6-35B-A3B'를 오픈소스로 공개했습니다. 자신보다 활성 파라미터가 10배나 큰 모델들과 맞먹는 수준의 에이전트 코딩(Agentic Coding) 능력과 강력한 멀티모달 추론 성능을 제공하는 것이 가장 큰 특징입니다. 실무자 입장에서 적은 컴퓨팅 자원으로도 고성능을 발휘할 수 있는 획기적인 오픈소스 AI 대안으로 평가받고 있습니다.

번역된 본문

큐웬3.6-35B-A3B(Qwen3.6-35B-A3B)를 만나보세요: 지금 오픈소스로 공개되었습니다! 🚀🚀

이 모델은 희소 MoE(Sparse MoE, Mixture of Experts) 아키텍처를 적용하여 총 파라미터는 35B(350억 개), 활성 파라미터는 3B(30억 개)로 구성되었으며, Apache 2.0 라이선스로 배포됩니다.

  • 자신의 활성 파라미터 크기보다 10배나 큰 모델들과 동등한 수준의 에이전트 코딩(Agentic coding) 성능
  • 강력한 멀티모달(Multimodal) 인식 및 추론 능력
  • 멀티모달 사고(Thinking) 모드와 비사고(Non-thinking) 모드의 결합

효율적이고(Efficient), 강력하며(Powerful), 다재다능한(Versatile) 모델입니다.

블로그:https://qwen.ai/blog?id=qwen3.6-35b-a3b

Qwen Studio:chat.qwen.ai

허깅페이스(HuggingFace):https://huggingface.co/Qwen/Qwen3.6-35B-A3B

ModelScope:https://modelscope.cn/models/Qwen/Qwen3.6-35B-A3B

원문 보기
원문 보기 (영어)
Meet Qwen3.6-35B-A3B:Now Open-Source!🚀🚀 A sparse MoE model, 35B total params, 3B active. Apache 2.0 license. \- Agentic coding on par with models 10x its active size \- Strong multimodal perception and reasoning ability \- Multimodal thinking + non-thinking modes Efficient. Powerful. Versatile. Blog:https://qwen.ai/blog?id=qwen3.6-35b-a3b Qwen Studio:chat.qwen.ai HuggingFace:https://huggingface.co/Qwen/Qwen3.6-35B-A3B ModelScope:https://modelscope.cn/models/Qwen/Qwen3.6-35B-A3B
관련 소식