메뉴
BL
Wired AI 45일 전

AI가 반도체 산업의 가장 큰 진입장벽을 허물다

IMP
8/10
핵심 요약

엔비디아의 아성을 이루는 핵심 무기인 칩 최적화 소프트웨어 생태계를 AI가 대체할 수 있는 가능성이 열렸습니다. Wafer와 같은 스타트업은 AI 모델을 활용해 특정 하드웨어에 맞춘 코드 최적화를 자동화하여, 엔비디아가 아닌 타사 칩의 경쟁력을 획기적으로 높이고 있습니다. 또한 AI가 칩 설계 자체를 혁신함에 따라, 소수 기업이 독점하던 실리콘 시장의 민주화가 가속화될 전망입니다.

번역된 본문

엔비디아(Nvidia)는 AI 칩 분야의 의심할 여지 없는 절대 강자입니다. 하지만 이 회사가 성장하는 데 기여한 AI 기술 덕분에, 이 챔피언도 곧 치열한 경쟁에 직면할 수 있습니다.

현대 AI는 엔비디아 설계를 기반으로 구동되며, 이러한 역학 덕분에 이 회사는 4조 달러를 훌쩍 넘는 시가총액을 달성했습니다. 새로운 세대의 엔비디아 칩이 출시될 때마다 기업들은 거대한 데이터 센터 내부에서 수백 또는 수천 개의 프로세서를 네트워크로 연결하여 더 강력한 AI 모델을 학습시킬 수 있습니다. 엔비디아 성공의 한 가지 이유는 새로운 세대의 칩을 프로그래밍하는 데 도움을 주는 소프트웨어를 제공하기 때문입니다.

하지만 이것은 머지않아 더 이상 엔비디아만의 차별화된 기술이 아닐 수 있습니다. 'Wafer(웨이퍼)'라는 스타트업은 AI 모델을 학습시켜 AI 분야에서 가장 어렵고 중요한 작업 중 하나, 즉 코드가 특정 실리콘 칩에서 최대한 효율적으로 실행되도록 최적화하는 작업을 수행하고 있습니다. Wafer의 공동 창립자이자 CEO인 에밀리오 안데레(Emilio Andere)는 오픈소스 모델에 강화 학습(reinforcement learning)을 적용하여, 운영 체제에서 하드웨어와 직접 상호 작용하는 소프트웨어인 '커널 코드(kernel code)'를 작성하도록 가르친다고 말합니다. 안데레는 또한 Anthropic의 Claude나 OpenAI의 GPT 같은 기존 코딩 모델에 '에이전트 하네스(agentic harnesses)'를 추가해 칩에서 직접 실행되는 코드를 작성하는 능력을 크게 향상시킨다고 덧붙였습니다.

현재 많은 유명 기술 기업들이 자체 칩을 보유하고 있습니다. 애플을 비롯한 여러 기업은 수년 동안 맞춤형 실리콘을 사용하여 노트북, 태블릿 및 스마트폰에서 실행되는 소프트웨어의 성능과 효율성을 개선했습니다. 반면 구글과 아마존 같은 기업은 자체 실리콘을 개발하여 클라우드 컴퓨팅 플랫폼의 성능을 높이는 데 주력하고 있습니다. 메타(Meta)는 최근 브로드컴(Broadcom)과 함께 개발한 새로운 칩을 사용해 1기가와트(GW) 규모의 컴퓨팅 용량을 배치하겠다고 발표했습니다. 맞춤형 실리콘을 배포하려면 새 프로세서에서 원활하고 효율적으로 실행될 수 있도록 수많은 코드를 작성해야 합니다.

Wafer는 AMD와 아마존을 포함한 기업들과 협력하여 소프트웨어가 자사 하드웨어에서 효율적으로 실행되도록 최적화하는 작업을 돕고 있습니다. 이 스타트업은 지금까지 구글의 제프 딘(Jeff Dean), OpenAI의 보이치에흐 자렘바(Wojciech Zaremba) 등으로부터 400만 달러의 시드 자금을 조달했습니다.

안데레는 회사의 AI 주도 접근 방식이 엔비디아의 지배력에 도전할 잠재력을 가지고 있다고 확신합니다. 최근 다수의 최첨단 칩은 엔비디아의 최고급 실리콘과 유사한 수준의 원시 부동소수점 성능(칩이 단순한 계산을 수행하는 능력을 나타내는 핵심 산업 벤치마크)을 제공하고 있습니다. 안데레는 "최고의 AMD 하드웨어, 최고의 [아마존] Trainium 하드웨어, 최고의 [구글] TPU는 엔비디아 GPU와 동일한 이론적 FLOPS를 제공합니다"라며, "우리는 와트당 지능을 극대화하고 싶다"고 최근 밝혔습니다.

이러한 칩에서 안정적이고 효율적으로 실행되도록 코드를 최적화하는 기술을 가진 성능 엔지니어는 고비용에 수요가 높은 반면, 엔비디아의 소프트웨어 생태계는 자사 칩을 위한 코드 작성과 유지 관리를 더 쉽게 만들어 줍니다. 이 때문에 가장 큰 기술 기업들조차 독자적으로 모든 것을 해결하기란 어렵습니다. 예를 들어, Anthropic이 아마존의 Trainium 기반으로 AI 모델을 구축하기 위해 파트너십을 맺었을 때, 하드웨어에서 최대한 효율적으로 실행되도록 처음부터 모델의 코드를 다시 작성해야 했다고 안데레는 전합니다.

물론 현재 Anthropic의 Claude를 비롯한 수많은 AI 모델은 이미 코드 작성 면에서 초인적인 능력을 보여주고 있습니다. 따라서 안데레는 AI가 엔비디아의 소프트웨어 이점을 빠르게 잠식하기 시작할 것으로 예상합니다. "해자(moat)는 칩의 프로그래밍 가능성에 존재합니다." 안데레는 엔비디아 하드웨어에 맞춰 코드를 쉽게 최적화할 수 있게 해주는 라이브러리와 소프트웨어 도구를 언급하며, "이것이 실제로 강력한 해자인지 다시 생각해 볼 때가 왔다고 생각합니다"라고 말했습니다.

AI는 서로 다른 실리콘을 위한 코드 최적화를 쉽게 만들 뿐만 아니라, 머지않아 칩 자체의 설계도 더 쉽게 만들 수 있을 것입니다. 전 구글 엔지니어인 아잘리아 미르호세이니(Azalia Mirhoseini)와 안나 골디(Anna Goldie)가 설립한 스타트업 'Ricursive Intelligence'는 AI를 활용해 컴퓨터 칩을 설계하는 새로운 방법을 개발하고 있습니다. 이 기술이 활성화된다면 훨씬 더 많은 기업이 칩 설계 분야로 진출하여 자체 소프트웨어를 더 효율적으로 구동하는 맞춤형 실리콘을 제작할 수 있을 것입니다.

원문 보기
원문 보기 (영어)
Comment Loader Save Story Save this story Comment Loader Save Story Save this story Nvidia is the undisputed king of AI chips . But thanks to the AI it helped build, the champ could soon face growing competition. Modern AI runs on Nvidia designs, a dynamic that has propelled the company to a market cap of well over $4 trillion. Each new generation of Nvidia chip allows companies to train more powerful AI models using hundreds or thousands of processors networked together inside vast data centers. One reason for Nvidia’s success is that it provides software to help program each new generation of chip. That may soon not be such a differentiated skill. A startup called Wafer is training AI models to do one of the most difficult and important jobs in AI—optimizing code so that it runs as efficiently as possible on a particular silicon chip. Emilio Andere, cofounder and CEO of Wafer, says the company performs reinforcement learning on open source models to teach them to write kernel code, or software that interacts directly with hardware in an operating system. Andere says Wafer also adds “agentic harnesses” to existing coding models like Anthropic’s Claude and OpenAI’s GPT to soup up their ability to write code that runs directly on chips. Many prominent tech companies now have their own chips. Apple and others have for years used custom silicon to improve the performance and the efficiency of software running on laptops, tablets, and smartphones. At the other end of the scale, companies like Google and Amazon mint their own silicon to improve the performance of their cloud-computing platforms. Meta recently said it would deploy 1 gigawatt of compute capacity with a new chip developed with Broadcom. Deploying custom silicon also involves writing a lot of code so that it runs smoothly and efficiently on the new processor. Wafer is working with companies including AMD and Amazon to help optimize software to run efficiently on their hardware. The startup has so far raised $4 million in seed funding from Google’s Jeff Dean, Wojciech Zaremba of OpenAI, and others. Andere believes that his company’s AI-led approach has the potential to challenge Nvidia’s dominance. A number of high-end chips now offer similar raw floating point performance—a key industry benchmark of a chip’s ability to perform simple calculations—to Nvidia’s best silicon. “The best AMD hardware, the best [Amazon] Trainium hardware, the best [Google] TPUs, give you the same theoretical flops to Nvidia GPUs,” Andere told me recently. “We want to maximize intelligence per watt.” Performance engineers with the skill needed to optimize code to run reliably and efficiently on these chips are expensive and in high demand, Andere says, while Nvidia’s software ecosystem makes it easier to write and maintain code for its chips. That makes it hard for even the biggest tech companies to go it alone. When Anthropic partnered with Amazon to build its AI models on Trainium, for instance, it had to rewrite its model’s code from scratch to make it run as efficiently as possible on the hardware, Andere says. Of course, Anthropic’s Claude is now one of many AI models that are now superhuman at writing code. So Andere reckons it may not be long before AI starts consuming Nvidia software advantage. “The moat lives in the programmability of the chip,” Andere says in reference to the libraries and software tools that make it easier to optimize code for Nvidia hardware. “I think it's time to start rethinking whether that's actually a strong moat.” Besides making it easier to optimize code for different silicon, AI may soon make it easier to design chips themselves. Ricursive Intelligence , a startup founded by two ex-Google engineers, Azalia Mirhoseini and Anna Goldie, is developing new ways to design computer chips with artificial intelligence. If its technology takes off, a lot more companies could branch into chip design, creating custom silicon that runs their software more efficiently. “We are going after the long poles of chip design—physical design and design verification,” says Mirhoseini, who is also an assistant professor at Stanford University, in reference to two of the main challenges involved with chip design. Designing computer chips is one of the most consequential—and tricky—jobs on the planet. Chip engineers need to figure out how to arrange a vast number of components across a piece of silicon to optimize different functionality. After a chip is first designed, its performance has to be carefully tested and verified in an iterative process before the designs can be sent off to a foundry. Nvidia’s designs are crucial for modern AI, with each new generation of chip allowing companies to train more powerful AI models using hundreds or thousands of processors networked together inside vast data centers. Mirhoseini and Goldie developed a way for AI to optimize the layout of key components of computer chips while at Google. The approach transformed how Google designs its own processors, and it is now widely used in the industry to help arrange features on different chips. Ricursive aims to go further, however, by automating more elements of chip design and integrating large language models into the process. The goal is to enable engineers to use natural language to describe changes or ask questions about a chip. Just as one can vibe code an app, perhaps eventually it will be possible to vibe design a chip. Ricursive is still developing its technology, but Mirhoseini says the company has already shown that it can optimize more aspects of chip design. The prospect of automating chip design in this manner has some investors salivating: Ricursive has raised $335 million at a $4 billion valuation in just a few months. Goldie says it may ultimately be possible to have AI codesign both chips and algorithms to make them more powerful. She says that having AI tweak its own silicon and code could form a recursive kind of AI improvement. “We are moving into this new regime where we can just spend more compute to design faster and better chips—creating a kind of scaling law for chip design.” What do you think of AI designing its own silicon? Leave a comment or send an email to [email protected] to let me know. This is an edition of Will Knight’s AI Lab newsletter . Read previous newsletters here.