토큰 부풀리기: 아마존 임직원들 내부 AI 순위 경쟁
아마존 내부에서는 개발자들의 AI 도입률 목표와 토큰 사용량을 공개하는 순위표 때문에, 실제 업무와 무관한 작업을 자동화하여 토큰 사용량을 억지로 높이는 이른바 '토큰 부풀리기(Tokenmaxxing)' 현상이 벌어지고 있습니다. 공식적으로는 성과 평가에 반영되지 않는다고 하지만, 실제로는 관리자들이 이를 주시하고 있어 직원들 간의 과도한 경쟁을 유발하고 있습니다. 메타(Meta) 등 다른 빅테크 기업 내에서도 비슷한 문제가 발생하는 것으로 전해집니다.
"토큰 부풀리기(Tokenmaxxing)"가 아마존 내부로 확산하고 있다. 직원들이 내부 AI 순위표에서 높은 순위를 차지하기 위해 시스템을 이용하고 있기 때문이다. 막시밀리안 슈나이더(Maximilian Schreiner) | 2026년 5월 12일
아마존(Amazon) 직원들이 내부 AI 리더보드(순위표)에서 순위를 올리기 위해 불필요한 작업을 자동화하고 있다. 사내 도구인 "MeshClaw(메스클로)"는 직원들이 코드 배포를 트리거하고, 이메일을 분류하거나 슬랙(Slack) 같은 앱과 상호작용할 수 있는 AI 에이전트를 만들 수 있게 해준다. 그러나 파이낸셜 타임스(FT)에 따르면, 직원들은 소프트웨어를 의도적으로 사용하여 인위적으로 토큰 소비량을 부풀리고 있다.
아마존의 한 직원은 FT와의 인터뷰에서 "이러한 도구를 사용해야 한는 압박감이 너무 크다"며 "어떤 사람들은 단지 토큰 사용량을 극대화하기 위해 MeshClaw를 사용하고 있다"고 말했다.
배경을 살펴보면, 아마존은 매주 개발자의 80% 이상이 AI를 사용하도록 목표를 설정했으며, 올해 초부터 내부 리더보드를 통해 토큰 소비량을 추적하기 시작했다.
공식적으로는 이 수치가 성과 평가에 반영되지 않는다고 한다. 하지만 다른 직원은 이렇게 반박했다: "관리자들이 그것을 주시하고 있습니다. 사용량을 추적하기 시작하면 역기능적인 인센티브가 생기고, 어떤 사람들은 그 부분에서 매우 경쟁적으로 변합니다."
메타(Meta) 직원들도 비슷한 '토큰 부풀리기'에 참여한 것으로 알려졌다.
실제 생산성 향상을 나타내는 지표로서 토큰 소비량은 거의 쓸모가 없다. 최신호 '프론티어 레이더(Frontier Radar)'에서는 AI 기반 생산성을 의미 있게 측정하는 것의 어려움에 대해 자세히 살펴보았다.
과장 없는 AI 뉴스 – 전문가가 직접 엄선한 콘텐츠. 광고 없는 읽기, 주간 AI 뉴스레터, 연 6회 독점 "AI 레이더" 프론티어 리포트, 전체 아카이브 액세스 및 댓글 섹션 이용을 원하신다면 THE DECODER에 구독하세요. 지금 구독하기 출처: FT