엔비디아, 12B~30B 크기 자유자재로 조절되는 '스타 일래스틱' 출시
엔비디아가 단 하나의 체크포인트(Checkpoint)에서 120억(12B), 230억(23B), 300억(30B) 파라미터 크기의 추론(Reasoning) 모델을 자유롭게 추출할 수 있는 '스타 일래스틱(Star Elastic)'을 공개했습니다. 제로샷 슬라이싱(Zero-Shot Slicing) 기술을 적용하여 모델을 처음부터 다시 학습할 필요 없이, 필요에 따라 즉각적으로 모델의 크기를 조절해 배포할 수 있다는 점이 가장 큰 특징입니다. 이는 다양한 하드웨어 환경과 예산에 맞춰 AI 모델을 유연하고 효율적으로 운영해야 하는 실무자들에게 배포 비용과 저장 공간을 혁신적으로 절감할 수 있는 중요한 돌파구가 될 것입니다.
엔비디아(NVIDIA) AI 연구팀이 '스타 일래스틱(Star Elastic)'이라는 혁신적인 AI 모델 아키텍처를 발표했습니다. 이 모델은 단 하나의 체크포인트(Checkpoint) 안에 120억(12B), 230억(23B), 300억(30B) 파라미터 크기의 세 가지 추론(Reasoning) 모델을 모두 내장하고 있습니다.
이 기술의 핵심은 '제로샷 슬라이싱(Zero-Shot Slicing)' 방식입니다. 연구진은 특정 크기의 모델이 필요할 때마다 처음부터 다시 모델을 학습시키거나 파인튜닝(Fine-tuning)할 필요 없이, 거대한 통합 체크포인트에서 원하는 크기의 모델을 즉각적이고 매끄럽게 잘라내어(슬라이싱) 사용할 수 있도록 설계했습니다. 슬라이싱된 하위 모델들은 각각의 크기에 맞게 최적화된 수준의 우수한 추론 성능을 발휘합니다.
이번 '스타 일래스틱'의 등장은 AI 실무자와 개발자들에게 획기적인 유연성을 제공합니다. 클라우드 서버의 고성능 GPU 환경에서는 300억 파라미터 모델을 구동하고, 자원이 제한된 엣지(Edge) 기기나 모바일 환경에서는 120억 파라미터 모델을 즉각적으로 추출해 배포하는 식의 상황에 맞춤형 대응이 가능해졌습니다. 결과적으로 여러 버전의 모델을 각각 저장하고 관리해야 하는 번거로움과 막대한 스토리지 비용을 대폭 줄이면서도, 다양한 하드웨어 환경에 최적화된 AI 서비스를 구축할 수 있게 되었습니다.