#시각 인지

r/MachineLearning • 102일 전

IMP 8

제로샷 세계 모델, 인간 아동 수준 데이터 효율 달성

본 논문은 인간 아동이 학습하는 것보다 기존 최고 수준 AI가 수십만 배 많은 데이터를 요구하는 한계를 극복하는 '제로샷 세계 모델(ZWM)'을 제안합니다. 단 한 명의 아동 시각 경험 데이터로만 학습된 BabyZWM은 별도의 작업 특화 학습 없이도 다양한 시각-인지 벤치마크에서 기존 SOTA 모델들과 맞먹는 성능을 보여줍니다. 이는 데이터 효율성을 획기적으로 높여 인간 수준의 유연한 학습이 가능한 차세대 AI 시스템 개발의 청사진을 제시한다는 점에서 매우 중요합니다.

세계 모델 제로샷 학습 데이터 효율성