중국 AI 기업 딥시크(DeepSeek)가 길어진 프롬프트를 효율적으로 처리하는 오픈소스 플래그십 모델 'V4'를 공개했습니다. V4는 Pro와 Flash 두 가지 버전으로 제공되며, 폐쇄형 최고급 모델들에 필적하는 성능을 저렴한 가격에 제공하여 개발자들에게 큰 의미를 갖습니다. 특히 코딩 및 에이전트(Agent) 작업, 수학, STEM 문제에서 강력한 오픈소스 대안으로 자리매김하며 업계의 이목을 끌고 있습니다.
번역된 본문
지난 금요일, 중국의 AI 기업 딥시크(DeepSeek)가 오랫동안 기다려왔던 새로운 플래그십 모델인 V4의 프리뷰(미리보기) 버전을 공개했습니다. 특히 이 모델은 대량의 텍스트를 더 효율적으로 처리할 수 있도록 돕는 새로운 설계 덕분에 이전 세대보다 훨씬 더 긴 프롬프트를 처리할 수 있습니다. 딥시크의 이전 모델들과 마찬가지로 V4는 오픈소스입니다. 즉, 누구나 다운로드하여 사용하고 수정할 수 있습니다. V4는 2025년 1월에 출시된 추론 모델인 R1 이후 딥시크의 가장 중요한 릴리스입니다. 제한된 컴퓨팅 리소스로 학습된 R1은 강력한 성능과 효율성으로 글로벌 AI 업계를 놀라게 했으며, 딥시크를 알려지지 않은 연구팀에서 하룻밤 만에 중국에서 가장 유명한 AI 기업으로 탈바꿈시켰습니다. 또한 이는 다른 중국 AI 기업들 사이에서 오픈 웨이트(Open-weight) 모델 출시 붐을 일으키는 데 기여했습니다.
그 이후 딥시크는 상대적으로 낮은 프로필을 유지해 왔습니다. 하지만 이번 달 초, 온라인 버전의 모델에 '전문가(Expert)' 및 '플래시(Flash)' 모드를 추가하면서 사실상 V4의 출시를 예고했고, 이 업데이트가 곧 있을 더 큰 릴리스와 관련이 있을 것이라는 추측을 낳았습니다. 이 회사는 중국의 AI 야망을 상징하는 강력한 존재가 되었지만, 최첨단 프론티어 모델로의 화려한 복귀는 핵심 인력의 이탈, 이전 모델 출시 지연, 미국과 중국 정부의 지속적인 감시 등 여러 달간의 조사와 감시 끝에 이루어졌습니다.
그렇다면 V4는 R1이 그랬던 것처럼 AI 분야를 뒤흔들 수 있을까요? 거의 확실히 그렇지는 않지만, 이번 출시가 중요한 세 가지 큰 이유가 있습니다.
오픈소스 모델을 위한 새로운 지평을 엽니다.
이전의 R1과 마찬가지로 딥시크는 V4의 성능이 저렴한 가격에 시중에서 구할 수 있는 최고의 모델들과 필적한다고 주장합니다. 이는 개발자와 기술을 사용하는 기업들에게 엄청난 호재입니다. 왜냐하면 급격히 치솟는 비용에 대한 걱정 없이, 원하는 방식대로 최첨단 AI 기능을 사용할 수 있게 되었기 때문입니다. 새 모델은 두 가지 버전으로 제공되며, 두 가지 모두 딥시크 웹사이트와 앱에서 사용할 수 있고 개발자를 위한 API 액세스도 열려 있습니다. V4-Pro는 코딩 및 복잡한 에이전트 작업을 위해 설계된 더 큰 규모의 모델이며, V4-Flash는 더 빠르고 저렴한 실행을 위해 설계된 소형 버전입니다. 두 버전 모두 모델이 사용자의 프롬프트를 주의 깊게 분석하고 문제를 해결하는 과정에서 각 단계를 보여주는 '추론 모드(Reasoning mode)'를 제공합니다. 딥시크는 V4-Pro의 경우 백만 입력 토큰당 1.74달러, 백만 출력 토큰당 3.48달러를 청구하며, 이는 OpenAI 및 Anthropic의 유사한 모델에 비해 비용의 일부분에 불과합니다. V4-Flash는 백만 입력 토큰당 약 0.14달러, 백만 출력 토큰당 약 0.28달러로 더 저렴하여, 현재 사용 가능한 가장 저렴한 최고급 모델 중 하나입니다. 이러한 점 때문에 V4는 애플리케이션을 구축하기 위한 매우 매력적인 모델이 될 것입니다.
성능 측면에서 V4는 어쩌면 당연하다는 듯이 R1에서 비약적인 도약을 이루었으며, 최근 출시된 거의 모든 주요 AI 모델에 대한 강력한 대안이 되는 것으로 보입니다. 회사가 공유한 결과에 따르면 주요 벤치마크에서 DeepSeek V4-Pro는 선도적인 폐쇄형 소스 모델과 경쟁하며, Anthropic의 Claude-Opus-4.6, OpenAI의 GPT-5.4, Google의 Gemini-3.1의 성능과 일치합니다. 그리고 알리바바의 Qwen-3.5나 Z.ai의 GLM-5.1과 같은 다른 오픈소스 모델과 비교할 때, DeepSeek V4는 코딩, 수학 및 STEM(이공계) 문제에서 이들 모두를 능가하여 지금까지 출시된 가장 강력한 오픈소스 모델 중 하나가 되었습니다. 딥시크는 또한 V4-Pro가 에이전트 코딩(Agentic coding) 작업 벤치마크에서 가장 강력한 오픈소스 모델 중 하나로 꼽히며, 다단계 문제 수행 능력을 측정하는 다른 테스트에서도 우수한 성능을 보인다고 밝혔습니다. 회사가 공유한 벤치마킹 결과에 따르면 작문 능력과 세계 지식 측면에서도 업계를 선도하고 있습니다. 모델과 함께 발표된 기술 보고서에서 딥시크는 85명의 숙련된 개발자를 대상으로 한 내부 설문 조사 결과를 공유했습니다. 90% 이상이 코딩 작업을 위한 최고의 모델 선택에 V4-Pro를 포함시켰습니다. 딥시크는 Claude Code, OpenClaw 및 CodeBuddy와 같은 인기 있는 에이전트 프레임워크를 위해 V4를 특별히 최적화했다고 밝혔습니다.
On Friday, Chinese AI firm DeepSeek released a preview of V4, its long-awaited new flagship model. Notably, the model can process much longer prompts than its last generation, thanks to a new design that helps it handle large amounts of text more efficiently. Like DeepSeek’s previous models, V4 is open source, meaning it is available for anyone to download, use, and modify. V4 marks DeepSeek’s most significant release since R1 , the reasoning model it launched in January 2025. R1, which was trained on limited computing resources, stunned the global AI industry with its strong performance and efficiency, turning DeepSeek from a little-known research team into China’s best-known AI company almost overnight. It also helped set off a wave of open-weight model releases from other Chinese AI firms. DeepSeek has kept a relatively low profile since then—but earlier this month, it effectively teased V4’s release when it added “expert” and “flash” modes to the online version of its model, prompting speculation that the updates were tied to a bigger upcoming release. While the company has become a powerful symbol of China’s AI ambitions, its big return to cutting-edge frontier models comes after months of scrutiny—including major personnel departures , delays to previous model launches , and growing scrutiny from both the US and Chinese governments. So, will V4 shake the AI field the way R1 did? Almost certainly not, but here are three big reasons why this release matters. 1. It breaks new ground for an open-source model. As with R1 before it, DeepSeek claims that V4’s performance rivals the best models available at a fraction of the price. This is great news for developers and for companies using the tech, because it means they can access frontier AI capabilities on their own terms, and without worrying about skyrocketing costs. The new model comes in two versions, both of which are available on DeepSeek’s website and in its app, with API access also open to developers. V4-Pro is a larger model built for coding and complex agent tasks, and V4-Flash is a smaller version designed to be faster and cheaper to run. Both versions offer reasoning modes, in which the model can carefully parse a user’s prompt and show each step as it works through the problem. For V4-Pro, DeepSeek charges $1.74 per million input tokens and $3.48 per million output tokens, a fraction of the cost of comparable models from OpenAI and Anthropic. V4-Flash is even cheaper, at about $0.14 per million input tokens and about $0.28 per million output tokens, making it one of the cheapest top-tier models available. This would make it a very appealing model to build applications on. In terms of performance, V4 is, perhaps unsurprisingly, a huge jump from R1—and it seems to be a strong alternative to just about all the latest big AI models. On the major benchmarks, according to results shared by the company, DeepSeek V4-Pro competes with leading closed-source models, matching the performance of Anthropic’s Claude-Opus-4.6, OpenAI’s GPT-5.4, and Google’s Gemini-3.1. And compared to other open-source models, such as Alibaba’s Qwen-3.5 or Z.ai’s GLM-5.1, DeepSeek V4 exceeds them all on coding, math, and STEM problems, making it one of the strongest open-source models ever released. DeepSeek also says that V4-Pro now ranks among the strongest open-source models on benchmarks for agentic coding tasks and performs well on other tests that measure ability to carry out multistep problems. Its writing ability and world knowledge also leads the field, according to benchmarking results shared by the company. In a technical report released alongside the model, DeepSeek shared results from an internal survey of 85 experienced developers: More than 90% included V4-Pro among their top model choices for coding tasks. DeepSeek says it has specifically optimized V4 for popular agent frameworks such as Claude Code, OpenClaw, and CodeBuddy. 2. It delivers on a new approach to memory efficiency. One of the key innovations of V4 is its long context window—the amount of text the model can process at once. Both versions can handle 1 million tokens, which is large enough to fit all three volumes of The Lord of the Rings and The Hobbit combined. The company says this context window size is now the default across all DeepSeek services and it matches what is offered by cutting-edge versions of models like Gemini and Claude. But it’s important to know not just that DeepSeek has made this leap, but how it did so. V4 makes significant architectural changes to the company’s former models—especially in the attention mechanism, which is the feature of AI models that helps them understand each part of a prompt in relation to the rest. As the prompt text gets longer, these comparisons become much more costly, making attention one of the main bottlenecks for long-context models. DeepSeek’s innovation was to make the model more selective about what it pays attention to. Instead of treating all earlier text as equally important, V4 compresses older information and focuses on the parts most likely to matter in the present moment, while still keeping nearby text in full so it does not miss important details. DeepSeek says this sharply reduces the cost of using long context. In a 1-million-token context, V4-Pro uses only 27% of the computing power required by its previous model, V3.2, while cutting memory use to 10%. The reduction in V4-Flash is even larger, using just 10% of the computing power and 7% of the memory. In practice, this could make it cheaper to build tools that need to work across huge amounts of material, such as an AI coding assistant that can read an entire codebase or a research agent that can analyze a long archive of documents without constantly forgetting what came before. DeepSeek’s interest in long context windows didn’t start with V4. Over the past year and a half, the company has quietly published a series of papers on how AI models “remember” information, experimenting with compression and mathematical techniques to extend what AI models could realistically handle. 3. It marks the first steps on the hard road away from Nvidia. V4 is DeepSeek’s first model optimized for domestic Chinese chips, such as Huawei’s Ascend—a move that has turned the launch into something of a test of whether China’s homegrown AI industry can begin to loosen its dependence on US chip giant Nvidia. This was largely expected, since The Information reported earlier this month that DeepSeek did not give American chipmakers like Nvidia and AMD early access to V4, though prerelease access is common to allow chipmakers to optimize support of the new model ahead of a launch. Instead, the company reportedly gave early access only to Chinese chipmakers. On Friday, Huawei said its Ascend supernode products, based on the Ascend 950 series, would support DeepSeek V4. This means that companies and individuals who want to run their own modified version of Deepseek V4 will be able to use Huawei chips easily. Reuters previously reported that Chinese government officials recommended that DeepSeek integrate Huawei chips in its training process. And this pressure fits a broader pattern in China’s industrial policy: Strategic sectors are often pushed, and sometimes effectively required, to align with national self-reliance goals. But there’s a particular urgency when it comes to AI. Since 2022, US export controls have cut Chinese firms off from Nvidia’s most powerful chips, and they later also restricted access to downgraded China-market versions. Beijing’s response has been to accelerate the push for a domestic AI stack, from chips to software frameworks to data centers. Chinese authorities have reportedly been pushing data centers and public computing projects to use more domestic chips, including through reported bans on foreign-made chips , sourcing quotas , and requirements to pair Nvidia chips with Chinese alternatives from companies such as Huawei a