메뉴
BL
TechCrunch AI 2일 전

인터넷, 기계 중심으로 재설계되다

IMP
8/10
핵심 요약

인간 중심으로 설계된 기존 클라우드 인프라는 초고속으로 트래픽을 폭증시켰다가 사라지는 AI 에이전트의 패턴을 감당하지 못합니다. 이에 따라 AWS는 에이전트 트래픽에 맞춰 초 단위로 확장 및 축소되고, 유휴 시에는 비용이 발생하지 않는 차세대 'OpenSearch Serverless'를 출시했습니다. 클라우드플레어는 2027년 상반기면 기계 트래픽이 인간 트래픽을 초과할 것으로 전망하며, AWS, Microsoft 등 글로벌 기업들은 에이전트 시대에 맞춰 인프라를 근본적으로 재편하고 있습니다.

번역된 본문

클라우드 인프라는 오랫동안 검색하고, 클릭하고, 스크롤하고, 안정적이고 예측 가능한 방식으로 스트리밍하는 인간을 중심으로 설계되어 왔다. AI 에이전트는 다르게 행동한다. 이들은 폭발적인 활동을 쏟아낼 수 있는데, 수백 개의 데이터베이스를 쿼리하고 문서를 검색하며 몇 초 만에 API를 호출하는 여러 하위 에이전트를 생성한 후, 나타났을 때처럼 빠르게 사라진다.

이러한 전제 아래, 아마존은 자사 클라우드 인프라의 핵심 조각을 재설계하고 있다. 목요일, AWS는 에이전트 워크로드(Agentic Workloads)를 위해 특별히 설계된 차세대 'OpenSearch Serverless'를 출시했다. 이는 완전 관리형 검색 및 벡터 데이터베이스로, 본질적으로 대규모로 정보를 저장하고 검색하는 시스템이다. AWS는 이 새로운 시스템이 에이전트가 작업을 트리거할 때 즉시 확장(scale up)하고, 유휴 상태일 때는 다시 제로(zero)로 축소(scale down)할 수 있다고 밝혔다.

이번 출시는 기술 산업 전반에 퍼지고 있는 깨달음을 반영한다. 인간 중심의 인터넷을 위해 원래 설계된 인프라는 점점 더 에이전트로 채워지는 세계에서는 제대로 작동하지 않는다는 것이다. AI 에이전트가 여전히 인터넷 활동의 비교적 작은 부분을 차지하고 있지만, 기계가 생성하는 트래픽은 이미 상당한 수준이며 급증할 태세다. 클라우드플레어(Cloudflare)에 따르면 지난 6개월 동안 봇이 전체 HTTP 트래픽의 31%를 차지했다. AI 크롤러, 검색 엔진 및 어시스턴트가 해당 기간 동안 모든 봇 요청의 약 4분의 1을 차지했다.

클라우드플레어의 라이 이 올슨(Lai Yi Ohlsen) 수석 프로덕트 매니저는 테크크런치와의 인터뷰에서 "2027년 상반기 어느 시점에 인간이 아닌 트래픽이 인간 트래픽을 초과할 것"이라고 말했다.

지난주 구글의 I/O 개발자 콘퍼런스에서 이 회사는 사용자가 구매 조사, 여행 예약, 웹 탐색 및 앱 상호작용과 같은 작업을 AI 시스템에 위임할 수 있게 될 것이라고 밝혔다. 하지만 소비자 중심의 AI 에이전트에서 끝나는 것이 아니다. 기업들은 내부 및 고객을 위해 점점 더 에이전트를 배포하고 있으며, 이는 무대 뒤에서 새로운 종류의 기계 생성 트래픽을 만들어내고 있다.

결과적으로 클라우드 제공업체와 인프라 기업들은 인간을 위해 구축된 시스템을 끊임없이 자율적으로 정보를 검색하고, 도구를 호출하며, 기계 간(M2M) 트래픽을 생성하는 에이전트의 세계에 어떻게 적응할지 고민하고 있다. 바로 이 지점에서 AWS의 새로운 OpenSearch Serverless가 등장한다.

아마존 OpenSearch 서비스의 티아 화이트(Tia White) 총괄 매니저는 테크크런치에 "시기는 명확하다. 에이전트가 실험 단계에서 실제 프로덕션(Production)으로 넘어가고 있으며, 기존 인프라가 전혀 설계되지 않았던 트래픽 패턴을 만들어낸다"고 말했다. 그녀는 "경고 없이 급증하고, 통보 없이 유휴 상태가 되며, 기업은 비어 있거나 유휴 상태인 컴퓨팅에 비용을 지불하지 않으면서도 이를 따라잡는 검색이 필요하다"고 덧붙였다.

이 차세대 시스템의 핵심적인 기술적 변화는 컴퓨팅(Compute)과 스토리지(Storage)를 분리(Decouples)하는 것이다. 이를 통해 에이전트 트래픽 버스트(burst)를 수용하기 위해 컴퓨팅을 몇 초 만에 확장할 수 있고, 제로로 축소할 수 있어 에이전트가 유휴 상태일 때 고객은 0달러를 지불하게 된다.

화이트는 "이전에는 이전 Serverless 버전에서도 스토리지와 컴퓨팅이 결합되어 있었기 때문에 최소 하나의 인스턴스는 가동 중이어야 했다"며, "필요한 속도에 맞춰 [컴퓨팅을] 자동으로 가동할 수 없었으므로 사용 여부와 상관없이 항상 워크로드를 위해 유휴 컴퓨팅을 예약해 두어야 했다"고 설명했다.

사용하지 않을 때도 항상 주차장 요금을 내는 것과 같다고 생각하면 된다. AWS의 업그레이드된 Serverless에서는 미터기가 있는 주차 공간에 비용을 지불하는 것과 더 비슷하다.

출시와 함께 OpenSearch Serverless는 Vercel 및 Kiro와 같은 AI 개발 플랫폼과 기본적으로 통합되어, 개발자가 인프라를 관리할 필요 없이 에이전트를 위한 프로덕션 준비가 완료된 검색 및 벡터 백엔드를 배포할 수 있다.

이러한 변화는 클라우드 산업 전반에 걸쳐 나타나고 있다. 데이터브릭스(Databricks)와 스노우플레이크(Snowflake)는 기업 데이터를 위한 AI 메모리 및 검색 시스템으로서의 입지를 재정립하고 있다. 마이크로소프트는 AI 에이전트 버스트를 처리하고 에이전트 간에 메모리를 공유하도록 설계된 Azure 업데이트를 출시했다. 클라우드플레어 역시 아마존과 유사한 맥락에서 지난달 에이전트에게 영구적인 환경과 즉각적인 컴퓨팅 파워를 제공하기 위한 인프라를 선보였다.

원문 보기
원문 보기 (영어)
Cloud infrastructure has long been designed around humans who search, click, scroll, and stream in a steady and predictable fashion. AI agents behave differently. They can unleash a swell of activity, spinning up multiple sub-agents that query hundreds of databases, search documents, and call APIs in seconds and then disappear as quickly as they arrived. Under that premise, Amazon is redesigning a core piece of its cloud infrastructure. On Thursday, AWS launched its next generation of OpenSearch Serverless , a fully managed search and vector database — essentially a system for storing and retrieving information at scale — that’s designed specifically for agentic workloads. AWS says the new system can instantly scale up when agents trigger tasks and scale back down to zero when idle. The launch reflects a growing realization across the tech industry: Infrastructure originally designed for a human-driven internet doesn’t work as well in a world increasingly populated by agents. While AI agents still represent a relatively small portion of internet activity, machine-generated traffic is already significant, and poised to grow. Cloudflare says bots accounted for 31% of overall HTTP traffic over the last six months. AI crawlers, search engines, and assistants made up roughly a quarter of all bot requests during that period. “Non-human traffic will exceed human traffic sometime in the first half of 2027,” said Lai Yi Ohlsen , senior product manager at Cloudflare, to TechCrunch. At Google’s I/O developer conference last week, the company said users will be able to start delegating tasks to AI systems, like researching purchases, booking travel, browsing the web, and interacting with apps. But the buck doesn’t stop at consumer-focused AI agents. Enterprises are increasingly deploying agents internally and for their customers, creating new kinds of machine-generated traffic behind the scenes. As a result, cloud providers and infrastructure companies have been reckoning with how to adapt systems built for humans to a world of agents that are constantly and autonomously retrieving information, invoking tools, and generating machine-to-machine traffic. That’s where AWS’s new OpenSearch Serverless comes in. “The timing is straightforward. Agents are moving from experimentation into production, and they create traffic patterns that previous infrastructure simply wasn't designed for,” Tia White, general manager for Amazon OpenSearch Service, told TechCrunch. "They spike without warning, they go idle without notice, and enterprise needs search that keeps up without paying for empty or idle compute.” The key technical change with this new generation is that it decouples compute from storage, allowing compute to scale up in seconds to accommodate agent traffic bursts and to scale down to zero, so customers pay $0 when agents are idle. “Previously, even in our prior Serverless version, you had to have at least one instance operational and running because storage and compute were coupled,” White said. “You couldn’t just automatically spin up [compute] at the rate you needed to, so you always had idle compute reserved for your workload, whether you were using it or not.” Think of it like always paying for a parking space, even when you’re not using it. With AWS’s upgraded Serverless, it’s more like paying for a metered parking spot. At launch, OpenSearch Serverless will integrate natively with AI development platforms like Vercel and Kiro, so developers can deploy production-ready search and vector backends for agents without managing infrastructure. The shift is emerging across the cloud industry. Databricks and Snowflake are repositioning themselves as AI memory and retrieval systems for enterprise data. Microsoft has rolled out updates to Azure designed to handle AI agent bursts and share memory between agents. Cloudflare, in a similar vein to Amazon, last month introduced infrastructure aimed at giving agents persistent environments and instant scalability. The more companies deploy AI agents, the more pressure there will be to redesign infrastructure around machine-generated workloads, which in turn could make agents cheaper and easier to deploy at larger scales. Loading the player… Topics agentic search , AI , AI agents , AWS , aws opensearch serverless When you purchase through links in our articles, we may earn a small commission . This doesn’t affect our editorial independence. Rebecca Bellan Senior Reporter Rebecca Bellan is a senior reporter at TechCrunch where she covers the business, policy, and emerging trends shaping artificial intelligence. Her work has also appeared in Forbes, Bloomberg, The Atlantic, The Daily Beast, and other publications. You can contact or verify outreach from Rebecca by emailing rebecca.bellan@techcrunch.com or via encrypted message at rebeccabellan.491 on Signal. View Bio October 13-15 San Francisco Early Bird ticket savings of up to $410 end May 29, 11:59 p.m. PT. Connect with 10,000+ tech leaders in unparalleled networking, 200+ hands-on sessions led by 250+ industry leaders, and discover 300+ showcasing startups. REGISTER NOW Most Popular Meta launches Instagram, Facebook, and WhatsApp subscriptions, with more to come, including AI plans Sarah Perez Tech CEOs are apparently suffering from AI psychosis Julie Bort DuckDuckGo installs are up 30% as users reject being ‘force-fed’ Google’s AI Search Rebecca Bellan Starship's path to reusability looks murky after SpaceX's S-1 Tim Fernholz 6 kitchen gadgets that make adulting feel easier Lauren Forristal I tried Amazon's Bee wearable and am both intrigued and slightly creeped out Lucas Ropek You can no longer Google the word ‘disregard' Russell Brandom