미국 제재받은 센스타임, 속도 특화 이미지 AI 모델 공개
중국 AI 기업 센스타임이 이미지를 텍스트로 변환하지 않고 직접 처리해 속도와 컴퓨팅 효율을 대폭 높인 오픈소스 모델 'SenseNova U1'을 공개했습니다. 이 모델은 미국의 반도체 수출 통제를 우회해 중국 국산 칩으로 구동 가능하다는 점에서 산업적 자립 의미가 큽니다. 센스타임은 이번 오픈소스 배포를 통해 딥시크 등 후발주자들에게 빼앗긴 기술 주도권을 회수하고 지정학적 제재를 넘어선 국제 협력을 도모할 계획입니다.
미국의 제재를 받은 중국 AI 기업 센스타임(SenseTime)이 화요일에 새로운 오픈소스 모델을 공개했다. 이 회사는 이 모델이 미국 경쟁사들이 개발한 최고 수준의 모델들보다 이미지를 생성하고 해석하는 데 있어 훨씬 빠르다고 주장했다. 'SenseNova U1'은 센스타임이 치열한 중국 AI 개발 경쟁에서 최전선 자리를 내어준 후 잃어버린 입지를 되찾는 데 도움이 될 수 있다. 이 모델의 핵심 기술은 이미지를 먼저 텍스트로 변환하지 않고 직접 '읽어' 들이는 능력이다. 이를 통해 처리 속도를 높이고 필요한 컴퓨팅 파워의 양을 줄였다.
센스타임의 공동 창립자이자 최고 과학자인 린다화(Dahua Lin)는 WIRED와의 인터뷰에서 “모델의 전체적인 추론 과정이 더 이상 텍스트에 국한되지 않으며, 이미지로도 추론할 수 있다”고 밝혔다. 홍콩 중문대학교 정보공학과 교수이기도 한 린은 이미지를 직접 처리할 수 있는 모델이 미래에 로봇이 물리적 세계를 더 잘 이해할 수 있게 해줄 것이라고 말한다.
딥시크(DeepSeek)의 최신 플래그십 모델과 마찬가지로 센스타임은 U1이 중국산 칩으로 구동될 수 있다고 밝혔다. 린은 “여러 중국 국내 칩 제조사가 새 모델과의 호환성 최적화를 마쳤다”고 말한다. 출시일인 화요일, 캄브리콘(Cambricon)과 바이런 테크놀로지(Biren Technology)를 포함한 10개의 중국 칩 설계사들이 자사 하드웨어가 U1을 지원한다고 발표했다. 이러한 유연성은 매우 중요하다. 미국의 수출 통제로 인해 중국 기업들이 세계에서 가장 진보된 AI 칩, 특히 훈련에 사용되는 칩(현재 주로 엔비디아와 같은 서방 기업들이 개발)에 접근하는 것이 제한되고 있기 때문이다.
린은 “다양한 칩에서 훈련을 계속 진행하기 위해 노력할 것”이라고 말했다. 하지만 그는 센스타임이 “반복적인 개발 속도를 보장하기 위해 여전히 최고의 칩을 사용해야 할 수도 있다”고 인정했다.
센스타임은 Hugging Face와 GitHub에 U1을 무료로 공개했다. 이는 중국 기업들이 어떻게 오픈소스 AI 생태계에서 가장 활발한 기여자가 되어가고 있는지를 보여주는 또 다른 징후다. 2014년에 설립된 센스타임은 안면 인식 및 자율주행과 같은 응용 분야에 사용되는 컴퓨터 비전 분야의 세계적 선도 기업이 되었다. 하지만 ChatGPT와 같은 자연어 처리 기반의 AI 시스템이 기술 산업의 가장 뜨거운 화두로 떠오르면서 센스타임은 수익을 내는 데 어려움을 겪기 시작했고, 딥시크(DeepSeek)나 미니맥스(MiniMax)와 같은 신생 스타트업들에 뒤처지게 되었다.
센스타임은 누구나 사용할 수 있도록 SenseNova U1을 공개적으로 배포함으로써 국내외 서방 AI 기업들과의 격차를 따라잡을 수 있기를 희망한다. 린은 연구원들로부터 유용한 피드백을 받아 기업이 더 빠르게 제품을 개선(iterate)할 수 있기 때문에 작년에 오픈소스에 집중하기로 최종 결정했다고 밝혔다. 린은 “요즘 시대에는 오픈소스냐 클로즈드 소스냐가 승패를 결정하는 요인이 아니다; 핵심은 개선 속도(iteration)다”라고 설명한다. 오픈소스로 전환하는 것은 센스타임이 지정학적 간섭 없이 국제 연구자들과 계속 협력하는 데에도 도움이 된다.
이 회사는 최근 몇 년간 위구르족 등 중국 신장위구르 지역의 소수민족을 감시하고 억류하는 감시 시스템에 자사의 안면 인식 기술이 사용되었다는 혐의로 미국 정부의 제재를 여러 차례 받았다. 그 결과 미국 기업들은 허가 없이 센스타임에 투자하거나 특정 기술을 판매하는 것이 제한되어 있다. (센스타임은 이러한 혐의를 부인했다.)
명확한 성능 차원에서 동반 기술 보고서에서 센스타임은 SenseNova U1이 현재 시장에 나와 있는 다른 모든 오픈소스 모델보다 더 고품질의 이미지를 생성한다고 주장한다. 알리바바의 큐웬(Qwen)과 바이트댄스의 시드림(Seedream)과 같은 중국의 최고 수준 클로즈드 소스 모델들과 성능이 비슷하지만, 불과 일주일 전에 나온 GPT-Image-2.0 같은 업계 선두주자들에는 여전히 뒤처진다.
하지만 이 모델의 주요 판매 포인트는 앞서 언급한 모델들보다 이미지를 훨씬 빠르게 생성하는 능력이다. 이는 센스타임이 올해 초 예고했던 'NEO-Unify'라는 혁신적인 기술 구조에 의존한다. 이 모델은...