인터넷, 기계 중심으로 재설계되다
인간 중심으로 설계된 기존 클라우드 인프라는 초고속으로 트래픽을 폭증시켰다가 사라지는 AI 에이전트의 패턴을 감당하지 못합니다. 이에 따라 AWS는 에이전트 트래픽에 맞춰 초 단위로 확장 및 축소되고, 유휴 시에는 비용이 발생하지 않는 차세대 'OpenSearch Serverless'를 출시했습니다. 클라우드플레어는 2027년 상반기면 기계 트래픽이 인간 트래픽을 초과할 것으로 전망하며, AWS, Microsoft 등 글로벌 기업들은 에이전트 시대에 맞춰 인프라를 근본적으로 재편하고 있습니다.
클라우드 인프라는 오랫동안 검색하고, 클릭하고, 스크롤하고, 안정적이고 예측 가능한 방식으로 스트리밍하는 인간을 중심으로 설계되어 왔다. AI 에이전트는 다르게 행동한다. 이들은 폭발적인 활동을 쏟아낼 수 있는데, 수백 개의 데이터베이스를 쿼리하고 문서를 검색하며 몇 초 만에 API를 호출하는 여러 하위 에이전트를 생성한 후, 나타났을 때처럼 빠르게 사라진다.
이러한 전제 아래, 아마존은 자사 클라우드 인프라의 핵심 조각을 재설계하고 있다. 목요일, AWS는 에이전트 워크로드(Agentic Workloads)를 위해 특별히 설계된 차세대 'OpenSearch Serverless'를 출시했다. 이는 완전 관리형 검색 및 벡터 데이터베이스로, 본질적으로 대규모로 정보를 저장하고 검색하는 시스템이다. AWS는 이 새로운 시스템이 에이전트가 작업을 트리거할 때 즉시 확장(scale up)하고, 유휴 상태일 때는 다시 제로(zero)로 축소(scale down)할 수 있다고 밝혔다.
이번 출시는 기술 산업 전반에 퍼지고 있는 깨달음을 반영한다. 인간 중심의 인터넷을 위해 원래 설계된 인프라는 점점 더 에이전트로 채워지는 세계에서는 제대로 작동하지 않는다는 것이다. AI 에이전트가 여전히 인터넷 활동의 비교적 작은 부분을 차지하고 있지만, 기계가 생성하는 트래픽은 이미 상당한 수준이며 급증할 태세다. 클라우드플레어(Cloudflare)에 따르면 지난 6개월 동안 봇이 전체 HTTP 트래픽의 31%를 차지했다. AI 크롤러, 검색 엔진 및 어시스턴트가 해당 기간 동안 모든 봇 요청의 약 4분의 1을 차지했다.
클라우드플레어의 라이 이 올슨(Lai Yi Ohlsen) 수석 프로덕트 매니저는 테크크런치와의 인터뷰에서 "2027년 상반기 어느 시점에 인간이 아닌 트래픽이 인간 트래픽을 초과할 것"이라고 말했다.
지난주 구글의 I/O 개발자 콘퍼런스에서 이 회사는 사용자가 구매 조사, 여행 예약, 웹 탐색 및 앱 상호작용과 같은 작업을 AI 시스템에 위임할 수 있게 될 것이라고 밝혔다. 하지만 소비자 중심의 AI 에이전트에서 끝나는 것이 아니다. 기업들은 내부 및 고객을 위해 점점 더 에이전트를 배포하고 있으며, 이는 무대 뒤에서 새로운 종류의 기계 생성 트래픽을 만들어내고 있다.
결과적으로 클라우드 제공업체와 인프라 기업들은 인간을 위해 구축된 시스템을 끊임없이 자율적으로 정보를 검색하고, 도구를 호출하며, 기계 간(M2M) 트래픽을 생성하는 에이전트의 세계에 어떻게 적응할지 고민하고 있다. 바로 이 지점에서 AWS의 새로운 OpenSearch Serverless가 등장한다.
아마존 OpenSearch 서비스의 티아 화이트(Tia White) 총괄 매니저는 테크크런치에 "시기는 명확하다. 에이전트가 실험 단계에서 실제 프로덕션(Production)으로 넘어가고 있으며, 기존 인프라가 전혀 설계되지 않았던 트래픽 패턴을 만들어낸다"고 말했다. 그녀는 "경고 없이 급증하고, 통보 없이 유휴 상태가 되며, 기업은 비어 있거나 유휴 상태인 컴퓨팅에 비용을 지불하지 않으면서도 이를 따라잡는 검색이 필요하다"고 덧붙였다.
이 차세대 시스템의 핵심적인 기술적 변화는 컴퓨팅(Compute)과 스토리지(Storage)를 분리(Decouples)하는 것이다. 이를 통해 에이전트 트래픽 버스트(burst)를 수용하기 위해 컴퓨팅을 몇 초 만에 확장할 수 있고, 제로로 축소할 수 있어 에이전트가 유휴 상태일 때 고객은 0달러를 지불하게 된다.
화이트는 "이전에는 이전 Serverless 버전에서도 스토리지와 컴퓨팅이 결합되어 있었기 때문에 최소 하나의 인스턴스는 가동 중이어야 했다"며, "필요한 속도에 맞춰 [컴퓨팅을] 자동으로 가동할 수 없었으므로 사용 여부와 상관없이 항상 워크로드를 위해 유휴 컴퓨팅을 예약해 두어야 했다"고 설명했다.
사용하지 않을 때도 항상 주차장 요금을 내는 것과 같다고 생각하면 된다. AWS의 업그레이드된 Serverless에서는 미터기가 있는 주차 공간에 비용을 지불하는 것과 더 비슷하다.
출시와 함께 OpenSearch Serverless는 Vercel 및 Kiro와 같은 AI 개발 플랫폼과 기본적으로 통합되어, 개발자가 인프라를 관리할 필요 없이 에이전트를 위한 프로덕션 준비가 완료된 검색 및 벡터 백엔드를 배포할 수 있다.
이러한 변화는 클라우드 산업 전반에 걸쳐 나타나고 있다. 데이터브릭스(Databricks)와 스노우플레이크(Snowflake)는 기업 데이터를 위한 AI 메모리 및 검색 시스템으로서의 입지를 재정립하고 있다. 마이크로소프트는 AI 에이전트 버스트를 처리하고 에이전트 간에 메모리를 공유하도록 설계된 Azure 업데이트를 출시했다. 클라우드플레어 역시 아마존과 유사한 맥락에서 지난달 에이전트에게 영구적인 환경과 즉각적인 컴퓨팅 파워를 제공하기 위한 인프라를 선보였다.