정체불명 Hy3, LLM 랭킹 1위 점령한 이유
대중에게 생소한 중국 텐센트의 오픈소스 모델 'Hy3 preview'가 최근 OpenRouter 모델 사용량 랭킹에서 최고의 인기를 누리던 Claude와 DeepSeek를 큰 폭으로 제치며 부상했습니다. 성능 벤치마크나 사용자 평가는 상위 모델들에 미치지 못하는 수준이지만, 입력 토큰당 약 $0.066라는 극도로 저렴한 가격 책정 덕분에 비용에 민감한 유료 사용자들을 대량으로 끌어들이며 유기적인 사용량 1위를 기록하고 있습니다. 이 현상은 최근 AI 코딩 에이전트 등의 비용이 급증함에 따라, 최고 수준의 성능보다 '가성비'를 선택하는 시장의 실용적인 트렌드를 보여준다는 점에서 중요합니다.
OpenRouter는 단일 API로 대부분의 LLM에 접근할 수 있게 해주는 서비스로, 최근 새로운 LLM이 쏟아지는 추세 덕분에 그 유용성이 매우 높아지고 있습니다. 사용자와 LLM API 사이의 중개자 역할을 하는 이 회사는 사용자가 LLM과 상호작용하는 방식에 대한 견고하고 대표성 있는 데이터를 보유하고 있으며, 경쟁상의 이유로 이러한 데이터를 일반적으로 비밀로 유지하는 연구소들과 달리 이를 'AI 모델 랭킹' 페이지에 공개하고 있습니다.
최저 타임에 OpenRouter 랭킹을 확인하다가 이상한 점을 발견했습니다. 두 개의 새로운 모델이 토큰 사용량 측면에서 업계의 대열인 Claude를 50% 이상의 큰 차이로 제치고 있다는 것입니다. 'DeepSeek Flash V4'에 대해서는 들어보았습니다. 이 모델은 DeepSeek의 오픈소스 출시작으로 빠르고 저렴할 뿐만 아니라 매우 낮은 비용으로 최고 수준의 LLM 모델과 근접한 성능을 내기 때문에 엄청난 인기를 끄는 것이 전혀 놀랍지 않습니다.
하지만 대체 'Hy3 preview'는 무엇일까요? Hy3나 이에 대해 이야기하는 사람에 대해 전혀 들어본 적이 없습니다. 구글링을 해보니 중국의 거대 기업인 텐센트(Tencent)가 Hy3를 오픈소스로 공개했다는 발표문이 나왔습니다. 하지만 Hugging Face의 모델 페이지는 정보가 거의 없었고, 다른 중국 오픈소스 모델들과 비교했을 때 이 모델에게 불리한 이상하리만치 솔직한 벤치마크 결과만 포함되어 있었습니다. 해커 뉴스(Hacker News)에서 Hy3를 검색해도 Hy3와 관련 없는 단 하나의 게시물만 반환되었고, 레딧(Reddit)의 논의는 주로 오픈 웨이트(open-weights) 공개에 관한 것이었습니다.
한 레딧 스레드에서도 Hy3의 부상을 언급했지만, 그것은 Hy3가 5월 6일에 OpenRouter를 통해 무료로 제공되던 시절의 이야기였습니다. 현재는 해당 무료 엔드포인트가 더 이상 사용 불가능하므로, 위 주간 랭킹에서 보이는 Hy3의 사용량은 전적으로 유료 사용자들에 의해 발생한 것입니다. 흥미롭게도 Hy3 preview는 에이전트 코딩 분야 외의 다른 영역에서도 인기가 있는 것으로 보입니다. 제가 뭔가 놓친 게 있을까요?
비과학적인 테스트를 거쳐본 결과, 모델의 품질은 벤치마크에 명시된 다른 중국 모델들과 확실히 비슷했지만 Claude Opus 4.7이나 GPT 5.5 같은 최상위 모델에는 미치지 못했습니다. 이는 세상에 알려지지 않은 숨겨진 보석 같은 모델이 아니므로, 여기에는 다른 무언가가 작용하고 있음이 틀림없습니다.
다행히 OpenRouter에는 가능한 설명의 범위를 좁힐 수 있는 데이터가 있습니다. 하지만 데이터를 확인한 후 저는 더욱 혼란스러워졌습니다. Hy3 preview는 OpenRouter API에서 1백만 토큰당 $0.066의 입력 가격으로 제공되며, 이는 현재 1위인 DeepSeek V4 Flash의 입력 가격인 1백만 토큰당 $0.10보다 실제로 더 저렴합니다. LLM과 코딩 에이전트의 비용이 급격히 상승하는 상황을 고려할 때, 더 저렴한 모델이 인기를 끄는 것은 이해되지만, 그것은 동등한 품질을 제공할 때만 해당하는 이야기이고 Hy3는 그렇지 않아 보입니다.
다음은 모델 페이지에서 가져온 시간 경과에 따른 Hy3 preview 사용량 차트입니다. Hy3 preview는 5월 8일 이전의 사용 데이터가 없는데, 이는 해당 시점에 모델이 무료 버전에서 유료 버전으로 전환되었음을 의미합니다. 또한 출시 후 여러 주가 지난 이번 포스팅의 초기 랭킹에 나타난 것을 보면, 그 이후로 사용량이 꾸준하여 이 사용량이 적어도 유기적(또는 조작하려면 매우 비용이 많이 드는 수준)이며 일회성 예외 현상이 아님을 보여줍니다.
흥미로운 점은, 여기에 제시된 숫자로 계산해 보면 현재 LLM API 호출에서 입력 토큰과 출력 토큰의 비율이 전체적으로 입력 98%, 출력 2%로 나타난다는 것입니다. OpenRouter AI 모델 랭킹의 역사를 보면, 특정 앱이 기본 모델을 다른 LLM으로 변경하면서 급증하는 현상이 있었습니다. 예를 들어 2025년 9월에 Kilo Code가 Grok Code Fast 1을 무료로 제공하면서 인기가 급등한 경우가 있었습니다. 하지만 Hy3 preview의 활동에서 앱이 차지하는 비중은 매우 적기 때문에 이번에는 해당하지 않는 것으로 보입니다.
OpenRouter의 핵심 가치는 주어진 API 요청을 다양한 제공업체(Provider)로 자동 라우팅할 수 있다는 것입니다. DeepSeek V4 Flash 같은 오픈 웨이트 모델의 경우 OpenRouter는 13개의 제공업체를 나열하지만, Hy3 preview는 오픈 웨이트임에도 불구하고 단 한 곳, 싱가포르에 본사를 둔 SiliconFlow만을 제공업체로 두고 있습니다. OpenRouter의 사용량 통계 페이지를 보면 SiliconFlow의 사용량은 Hy3가 등장하기 전까지는 상대적으로 거의 없었습니다... (본문 마지막 부분이 시각화 데이터에서 잘린 것으로 보입니다.)