메뉴
HN
Hacker News 48일 전

애플의 우연한 해자: AI 패배자가 최종 승자가 되는 법

IMP
8/10
핵심 요약

AI 모델의 지능이 빠르게 평준화(일상화)되면서, 막대한 자본을 태우는 인프라 경쟁 대신 엄청난 현금을 보유한 채 기기를 통한 온디바이스 AI 통합에 집중해 온 애플이 유리한 고지를 점하게 되었습니다. 거대 AI 모델 구축에 천문학적 자금을 소모하고도 수익성을 입증하지 못해 위기에 처한 오픈AI 등의 사례와 대비되어, 향후 플랫폼 점유율과 실질적 사용자 경험을 중심으로 한 AI 산업의 패러다임 전환을 시사합니다.

번역된 본문

몇 주 전 저는 지능(intelligence)이 점차 일상적인 상품(commodity)이 되고 있다는 생각에 대해 글을 쓴 적이 있습니다. 이러한 생각은 꽤 단순하며, 이제는 널리 퍼진 통념이 되었습니다. 모두가 최고의 모델을 만들기 위해 경쟁할 때, 모델들은 더 나아지지만 결국 다른 모델들도 마찬가지로 좋아집니다. 더 큰 규모의 학습에 투자된 모든 달러는 이전 학습 모델의 가치를 더 저렴하게 만듭니다. 최고 수준의 프론티어 모델, 2위 모델, 그리고 오픈소스 대안 모델들 사이의 격차는 빠르게 붕괴하고 있습니다. (사실 요즘 Gemma 4, Kimi K2.5, GLM 5.1은 제가 매일 애용하는 모델이 되었습니다.) 나아가 모델이 발전함에 따라, 상대적으로 낮은 사양의 로컬 하드웨어에 배포할 수 있는 지능의 단위 역시 크게 증가합니다.

이 상황의 아이러니한 점은, 이러한 지능의 상품화가 모든 사람이 'AI 패배자'라고 평가하던 바로 그 기업, 애플(Apple)에게 이익이 되고 있다는 것입니다.

'패배했던' 기업 최근 3년 동안의 애플은 어떤 면에서는 진짜 AI 경쟁에서 실패한 것처럼 보였습니다. 그들은 누구보다 먼저 시리(Siri)라는 진지한 음성 비서를 보유하고 있었음에도 불구하고, 챗GPT가 첫 출시(심지어 네이티브 음성 상호작용을 도입하기도 전)되자마자 자신들의 점심밥을 빼앗기는 모습을 지켜봐야 했습니다. 애플은 최고 수준의 프론티어 모델(또는 겉치레용 오픈소스 모델조차)도 없었고, 흔히들 예상하는 거대 기술 기업들처럼 5,000억 달러 규모의 컴퓨팅 투자 약속도 하지 않았습니다. 그 대신, 다른 AI 연구소나 빅테크 기업들이 최고 수준의 벤치마크 기록을 세우기 위해 현금 봉지를 불태우며 경쟁하는 동안, 애플은 미배포 현금 더미 위에 앉아(주식 매입을 늘릴 정도로) 선택의 여지를 가지고 있었습니다.

제게 있어 오픈AI는 이 '무한 자금 소모 기계'의 가장 전형적인 예시입니다. 오픈AI는 3,000억 달러의 기업가치로 자금을 조달했음에도 불구하고, 창의 산업의 기함으로 포지셔닝했던 비디오 제품 '소라(Sora)'를 폐쇄했습니다. 하루 수익이 210만 달러에 불과한 반면, 하루 운영 비용은 약 1,500만 달러에 달했기 때문입니다. 디즈니는 이미 소라를 활용해 마블, 픽사, 스타워즈 캐릭터로 콘텐츠를 제작하기 위해 3년간의 라이선스 계약을 체결한 상태였습니다. 또한 오픈AI에 10억 달러의 지분 투자를 확정하려던 찰나였죠. 소라가 사라지면서 그 10억 달러도 함께 사라졌습니다. 제품이 자체적인 비용을 감당하지 못하면서 10억 달러짜리 투자가 증발해 버린 것입니다(이는 그들의 막대한 일상적 자금 소모를 견디는 완충제를 줄여버렸습니다).

인프라 측면을 살펴보면, 오픈AI는 삼성과 SK하이닉스와 월 90만 장의 DRAM 웨이퍼(전 세계 생산량의 약 40%)를 공급받기 위한 비구속적 양해각서(MOU)를 체결했습니다. 물론 이는 법적 구속력이 없는 것이었습니다. 마이크론(Micron)은 이러한 수요 신호를 읽고 29년된 소비자용 메모리 브랜드인 '크루셜(Crucial)'을 폐쇄한 뒤, 모든 생산 능력을 AI 고객사로 돌렸습니다. 그 후 '스타게이트 텍사스(Stargate Texas)' 프로젝트가 취소되었습니다. 오픈AI와 오라클(Oracle)이 조건을 합의하지 못하면서, 마이크론의 전체적인 전략적 회심을 정당화했던 수요가 순식간에 사라져 버린 것입니다. 결국 마이크론의 주가는 폭락했습니다.

여러분은 어떠신지 모르겠지만, 저는 이러한 행보들이 벤치마크에서 모델이 아무리 좋은 성과를 내고 인프라에 얼마나 많은 자금을 쏟아부었든 간에, 이들이 이른바 'AI 경쟁에서 승리하고 있다'고 보기 어렵습니다. 예상 수익에 대한 작은 계산 착오만으로도 게임에서 퇴출될 수 있습니다. (저는 어떤 형태로든 구제금융을 받지 못한다면 오픈AI가 향후 18~24개월 내에 파산할 수 있다고 생각하지만, 제 예측은 대개 형편없이 틀리곤 합니다.)

지능에서 역량으로 AI 연구소들의 원래 베팅은 항상 '원시 모델의 성능, 즉 지능'과 '이를 구동하는 데 필요한 인프라'가 계속 희소성을 유지할 것이라는 것이었습니다. 최고의 모델을 확보하고 이를 대규모로 운영할 인프라를 갖춘 기업이 가장 강력한 해자(moat)를 얻게 될 것이라 믿었죠.

하지만 안타깝게도 앞으로는 단순히 최고의 모델을 보유하는 것만으로는 충분하지 않을 수 있습니다. 성능이 낮은 모델들조차도 이전 세대의 최고 수준 모델만큼의 성능을 내고 있습니다. 제가 생각할 수 있는 가장 좋은 최근의 사례는 구글의 오픈 웨이트(open-weight) 모델인 'Gemma 4'입니다. 이 모델은 스마트폰에서도 실행될 수 있도록 구축되었으며... (후략)

원문 보기
원문 보기 (영어)
@adlrocha - How the "AI Loser" may end up winning Apple’s accidental moat adlrocha Apr 12, 2026 1 Share A few weeks ago I wrote about how I thought intelligence is becoming a commodity . The idea is quite straightforward, and widespread now: when everyone races to build the best model, the models get better, but so does every other model eventually. Every dollar spent on a bigger training run makes the previous one cheaper. The distance between frontier, second-best, and open-source alternatives is collapsing fast (actually Gemma4, Kimi K2.5 and GLM 5.1 are becoming my bedside models these days) . Even more, as models become better, the unit of intelligence that can be deployed in local hardware with lower hardware capabilities increases significantly. The irony of this situation is that this commoditisation of intelligence is benefiting the company that everyone was framing as the “AI loser”: Apple The company that “lost” There’s a version of the last three years where Apple genuinely failed at AI. They had Siri before anyone had a serious voice assistant, and then watched how ChatGPT ate their lunch already since their first release (even before they had introduced their native voice interaction) . Apple didn’t have a flagship frontier (or even a vanity open-source) model, no $500B compute commitment with the usual suspects. Meanwhile, the rest of the AI labs and big tech companies were racing to win the next state-of-the-art benchmark by burning bags of cash. What this also meant is that while these companies were burning money at a rate that would make a sovereign wealth fund uncomfortable, Apple was (and still is) sitting in a pile of undeployed cash (to the point of even increasing their stock buybacks) giving them optionality . To me, OpenAI is the most paradigmatic example of this “infinite money burning machine”. OpenAI raised at a $300B valuation and then shut down Sora, the video product they’d been positioning as a creative industry flagship, because it was running at roughly $15M a day in costs against $2.1M in daily revenue . Disney had already signed a three-year licensing deal for Sora to generate content from Marvel, Pixar, and Star Wars characters. They were finalising a $1B equity stake in OpenAI . When Sora died, so did the billion. A $1B investment evaporated, because the product it was staked on couldn’t pay for itself (reducing their buffer that accommodates their daily burn). On the infrastructure side: OpenAI signed non-binding letters of intent with Samsung and SK Hynix for up to 900,000 DRAM wafers per month, roughly 40% of global output . These were of course non-binding. Micron, reading the demand signal, shut down its 29-year-old Crucial consumer memory brand to redirect all capacity toward AI customers. Then Stargate Texas was cancelled , OpenAI and Oracle couldn’t agree terms, and the demand that had justified Micron’s entire strategic pivot simply vanished. Micron’s stock crashed . I don’t know about you, but I don’t see these behaviours as those of someone that is winning the AI race, independently of how good their models do in benchmarks, and how much they are burning in infrastructure. A small miscalculation in the expected revenue, and you are out of the game (I am actually of the opinion that without some kind of bailout, OpenAI could be bankrupt in the next 18-24 months, but I am horrible at predictions). From intelligence to capabilities My sense is that the labs’ bet was always that raw model capability, i.e. intelligence, along with the infrastructure required to run them would stay scarce. Those who manage to secure the best model and the infrastructure to run it at scale would get the best moat . But I am afraid that having the best model in itself may not be enough moving forward. Less capable models are becoming as capable as previous versions of the frontier models. The best recent example I can think of is Gemma 4 , Google’s open-weight model. It was built to run on a phone, scores 85.2% on MMLU Pro and matches Claude Sonnet 4.5 Thinking on the Arena leaderboard. 2 million downloads in its first week . Models that would have been state-of-the-art eighteen months ago now run on a laptop, and they get better every quarter. If you haven’t tried Gemma4 yourself I highly recommend it. I am running it on my AMD Ryzen AI Max+, and its performance in terms of tokens per second and intelligence are so good that I have already migrated some of my personal tools to use this model as the backend without visibly impacting their output. This trend can really change in the next few months way we access intelligence. I feel that some of the labs see this coming. Anthropic has been particularly aggressive about it and they are releasing new (actually useful) tools every day that work like a charm with their models in order to lock users into their ecosystem. Claude Code for developers, Claude Cowork for teams, the recent Claude Managed Sessions to orchestrate agents , all designed to put Claude inside workflows people are already in. The logic behind it: if the model itself won’t hold the moat, capture the usage layer and make switching painful. I think this is brilliant, and seeing how much Anthropic is growing in number of users and revenue, it seems to be paying off. The economics of their plans are still rough, though. One analysis found a max-plan subscriber consuming $27,000 worth of compute with their 200$ Max subscription. The labs are subsidising the demand they’re chasing, which justifies their level of burn (let’s see for how long they can afford these subsidies). Apple, by contrast, has spent almost nothing on AI infrastructure and subsidising users’ token burn. And this may be giving them more optionality and leverage than any of the other companies that jumped heads first into the AI race. Context is all you need In that earlier post , I argued tha t if intelligence becomes abundant, context becomes the scarce resource. A model that can reason about anything but knows nothing about you or the environment it operates in is a generic tool. What makes AI genuinely useful day-to-day is reasoning plus personal context: your messages, your calendar, your code, your tools, your health data, your photos, your habits. I think here is where Anthropic is making an amazing job with their “Claude suite”. But Apple already has all this context and access to your environment through their 2.5 billion active devices. Each one is a context mine that users have been filling for years. Health data from Apple Watch. Every photo taken on an iPhone. Notes, messages, location history, app behaviour, emails, and awareness of your environment through the pool of sensors of your device. Why build a commodity when they already have the context that can become their moat? And they even have the ability to keep all this data on-device, which is where the “Privacy. That’s iPhone” positioning becomes something more than a PR strategy, and which could actually make a comeback to become one of their core value propositions. Apple spent years using privacy as a differentiator against the ad-driven models of Google and Meta. It worked, but it always felt a bit abstract and, honestly, fake. Now it could become really concrete. Would you hand OpenAI your medical records and fifteen years of photos to get better AI answers? Probably not. Some are, but I personally wouldn’t like Sam to have that personal data from me. Would you let a model running entirely on your device (no network request, no data leaving your phone) access all of that? That’s a different question. The on-device model gets full context because it never leaves the hardware. Apple built the reputation and the architecture for this when no one else thought it mattered. Of course, there are still technological barriers to make this possible, but I feel like we may be getting there. In this context, the Gemini deal , where Apple signed a $1B to license Google’s frontier model f