스타트업의 승부수, 토큰 극대화로 차세대 클라우드 강자 도약
AI 개발자들의 핵심 요구인 '빠르고 저렴한 토큰' 제공에 집중하는 스타트업 Parasail(파라세일)이 3,200만 달러의 시리즈 A 투자를 유치했습니다. 이 회사는 자체 칩을 소유하지 않고 전 세계 데이터센터의 유휴 GPU 자원을 유연하게 연결하여, 오픈소스 모델과 AI 에이전트 개발에 필수적인 '추론(Inference)' 비용을 획기적으로 낮추는 인프라를 제공합니다.
"토큰을 주세요. 그냥 토큰이 필요해요. 빨리, 저렴하게, 당장 주세요." 이것은 생성형 AI 모델 기반으로 소프트웨어를 개발하는 개발자들의 주문이며, 적어도 Parasail의 CEO 마이크 헨리(Mike Henry)가 듣는 핵심 요구사항이다. AI 모델 추론(Inference)을 실행하는 기업들에 클라우드 컴퓨팅 서비스를 제공하는 Parasail은 하루에 5,000억 개의 토큰을 생성한다고 밝혔다. 이른바 '토큰 극대화(Tokenmaxxing)'의 좋은 사례가 아닐 수 없다.
헨리는 LLM에 특화된 칩 제조사인 Groq의 임원 출신으로, AI 모델 기반 소프트웨어 개발자들이 그들의 요구에 맞춰진 특화된 클라우드 처리를 원할 것이라는 점을 일찍이 간파하고 해당 회사의 클라우드 서비스를 구축한 바 있다. 이제 1년 전 스텔스 모드(비공개 개발 단계)를 벗어난 Parasail은 이러한 서비스를 대규모로 확장하기 위해 3,200만 달러 규모의 시리즈 A 투자를 유치했다.
헨리는 물리적 칩 설계 배경을 가지고 있지만, Parasail은 자체 칩을 소유하는 데 집착하지 않는다. 일부 자체 GPU를 보유하고는 있으나, 주로 전 세계 15개국 40개 데이터센터의 프로세서 처리 시간을 빌리고 유동성 시장에서 추가로 구매하여 백그라운드에서 이를 모두 조율하며 추론 요청 비용을 낮춘다. 워크로드를 지능적으로 할당하고 수요 피크(최대치)를 회피함으로써, 자체 실리콘을 보유하고 있어 기존 고객의 약정이나 워크로드에 의해 제약을 받을 수 있는 기업들과 경쟁하려는 목표를 가지고 있다.
이 회사의 잠재력은 프론티어 모델(최첨단 모델)을 개발하는 대형 AI 연구소 외부에서 오픈소스 모델과 AI 에이전트가 지속적으로 확산되는 데 달려 있다. Parasail의 경영진과 투자자들은 이러한 흐름이 Anthropic이나 OpenAI 같은 기업의 서비스를 이용할 때 발생하는 비용 증가와 마찰 요인 때문에 촉발되고 있다고 말한다. 과학 문헌용 리서치 어시스턴트를 개발하기 위해 2,200만 달러 규모의 시리즈 A를 유치한 스타트업 Elicit의 CEO 안드레아스 슈트뮐러(Andreas Stuhlmüller)에 따르면, 대신 하이브리드 아키텍처가 떠오르고 있다. 최상위 제약회사의 고객들은 그의 LLM 기반 도구를 사용하여 수만 편의 과학 논문에서 나온 데이터를 검토하고 분석한다.
[TechCrunch 이벤트 안내 생략]
슈트뮐러는 TechCrunch와의 인터뷰에서 "우리가 오픈 모델로 더 많이 이동한 이유는 엔드포인트에 수십만 건의 요청을 보내는 것이 꽤나 부담스럽기 때문"이라며, 특히 에이전트를 활용해 서비스를 고도화하고, 작업을 분할하며 장기적인 관점에서 더 전략적으로 일을 처리하게 된 지금은 더욱 그렇다고 말했다. 오픈 모델이 초기 스크리닝을 처리하여 작업 비용을 낮추고, 이후 더 유능한 최첨단 프론티어 모델이 최종 답변을 제공하는 방식이다.
에이전트가 소프트웨어 개발에서 점점 더 일반적인 요소로 자리 잡으면서 모델 쿼리가 폭발적으로 증가하고 있으며, 이는 저렴한 추론용 인프라를 제공하는 Parasail 같은 기업에 대한 투자를 이끌고 있다. 이번 투자 라운드를 공동 리드한 Touring Capital의 파트너 사미르 쿠마르(Samir Kumar)는 미래에 소프트웨어 개발 비용 중 추론 비용이 적어도 20%를 차지할 것으로 예상한다.
이 시장에서 Parasail이 차지할 수 있는 몫은 얼마나 될까? 경쟁이 치열한 클라우드 컴퓨팅 시장에서 헨리는 추론에만 집중(모델 학습은 취급하지 않음)하고 장기 계약 없이 스타트업 고객을 수용하려는 의지가, 엔터프라이즈 비즈니스에 집중하는 대형 클라우드 컴퓨팅 회사나 Fireworks AI, Baseten 등 클라우드 추론 분야의 자금력이 더 두터운 경쟁사와 차별화된다고 주장한다. 물론 모든 고객이 초기 시드(Seed) 단계나 시리즈 B 단계의 스타트업일 경우에는 또 다른 종류의 리스크가 존재하게 되지만 말이다.