딥시크, 최신 AI 모델 V4 공개…
중국의 AI 연구소 딥시크(DeepSeek)가 최신 대규모 언어 모델인 DeepSeek V4(Flash 및 Pro)의 프리뷰 버전을 공개했습니다. 이번 모델은 최대 1.6조 개의 파라미터를 갖춘 오픈웨이트 모델로서, 미스트럭스(Mixture-of-experts) 방식을 채택해 추론 비용을 절감하면서도 추론 및 코딩 벤치마크에서 최고 수준의 폐쇄형 모델들과 거의 차이를 좁혔습니다. 특히 기존 최고 성능 모델들과 비교해 압도적으로 저렴한 API 사용 비용을 제공하며 시장의 경쟁력을 확보하고 있습니다.
중국의 AI 연구소 딥시크(DeepSeek)는 작년에 출시되어 AI 업계를 뒤흔든 V3.2 모델 및 R1 추론 모델의 오랜 기다림 끝의 업데이트인 최신 대규모 언어 모델, DeepSeek V4의 두 가지 프리뷰 버전을 공개했습니다.
딥시크에 따르면 DeepSeek V4 Flash와 V4 Pro는 모두 100만 토큰의 컨텍스트 윈도우를 갖춘 미스트럭스(Mixture-of-experts) 모델이며, 이는 대규모 코드베이스나 문서를 프롬프트에 포함시키기에 충분한 용량입니다. 미스트럭스 방식은 작업당 특정 수의 파라미터만 활성화하여 추론 비용을 낮추는 기술입니다.
Pro 모델은 총 1.6조 개의 파라미터(그중 490억 개 활성)를 보유하고 있어, 현재 사용 가능한 가장 큰 오픈웨이트 모델이 되었습니다. 이는 문샷 AI(Moonshot AI)의 Kimi K 2.6(1.1조), 미니맥스(MiniMax)의 M1(4560억)을 뛰어넘고, 기존 DeepSeek V3.2(6710억)의 두 배 이상 규모입니다. 보다 작은 버전인 V4 Flash는 2840억 개의 파라미터(130억 개 활성)를 보유하고 있습니다.
딥시크는 두 모델 모두 아키텍처 개선으로 인해 DeepSeek V3.2보다 효율성과 성능이 뛰어나며, 추론 벤치마크에서 오픈소스 및 폐쇄형 기반의 현재 최고 수준 모델들과 격차를 거의 "close the gap" 좁혔다고 밝혔습니다. 딥시크는 새로운 V4-Pro-Max 모델이 추론 벤치마크에서 오픈소스 동급 모델을 능가하며, 일부 작업에서는 OpenAI의 GPT-5.2와 Gemini 3.0 Pro를 앞선다고 주장합니다. 코딩 대회 벤치마크에서는 두 V4 모델의 성능이 "GPT-5.4와 비슷한 수준"이라고 덧붙였습니다.
그러나 이 모델들은 지식 테스트, 특히 OpenAI의 GPT-5.4와 구글의 최신 Gemini 3.1 Pro와 비교할 때 최신 모델들에 비해 약간 뒤처지는 것으로 보입니다. 이러한 지연은 "최첨단 모델보다 약 3~6개월 뒤진 개발 궤적"을 보여준다고 연구소는 전했습니다. 오디오, 비디오 및 이미지의 이해와 생성을 지원하는 많은 폐쇄형 모델들과 달리, V4 Flash와 V4 Pro 모두 텍스트만 지원합니다.
주목할 점은, DeepSeek V4가 오늘날 사용 가능한 어떤 최신 모델보다도 가격이 훨씬 저렴하다는 것입니다. 작은 버전인 V4 Flash 모델은 백만 입력 토큰당 0.14달러, 백만 출력 토큰당 0.28달러의 비용이 들어 GPT-5.4 Nano, Gemini 3.1 Flash, GPT-5.4 Mini, Claude Haiku 4.5보다 저렴합니다. 반면 더 큰 V4 Pro 모델은 백만 입력 토큰당 0.145달러, 백만 출력 토큰당 3.48달러로 Gemini 3.1 Pro, GPT-5.5, Claude Opus 4.7, GPT-5.4보다 가격이 낮습니다.
이번 출시는 미국이 중국이 수천 개의 프록시 계정을 사용하여 미국 AI 연구소의 지식재산권을 산업 규모로 도난했다고 비난한 지 하루 만에 이루어졌습니다. 딥시크 자체도 안스로픽(Anthropic)과 오픈AI(OpenAI)로부터 그들의 AI 모델을 본질적으로 복사하는 일종의 '증류(distilling)'를 했다는 비난을 받아왔습니다.