메뉴
BL
The Decoder 29일 전

xAI, 대폭 할인된 가격의 '그록 4.3'과 크리에이티브 에이전트 모드 공개

IMP
7/10
핵심 요약

일론 머스크의 xAI가 실용적인 작업 수행과 비용 효율성에 초점을 맞춘 새로운 AI 모델 '그록 4.3(Grok 4.3)'을 출시했습니다. 이번 업데이트는 전 모델 대비 약 40~60% 절감된 파격적인 가격과 함께, 장기적인 콘텐츠 제작을 돕는 '그록 이매진 에이전트 모드(Grok Imagine Agent Mode)' 베타 버전을 포함하고 있습니다. 실제 업무 환경의 벤치마크에서는 경쟁사 최상위 모델들에는 미치지 못하지만, 가격 대비 뛰어난 성능을 제공하여 실무자와 기업들에게 매력적인 선택지가 될 것으로 보입니다.

번역된 본문

xAI가 더 저렴하고 성능이 향상된 실용적인 작업 중심의 모델, 그록 4.3을 공개했습니다. 이번 출시에는 에이전트 기반의 새로운 이미지 생성 도구도 포함되었습니다.

xAAI 개발자 에릭 장(Eric Jiang)에 따르면, 그록 4.3은 속도, 저비용, 도구 호출에 초점을 맞춰 개발자와 기업을 위해 설계되었습니다. 이 모델은 웹 검색, X(옛 트위터) 검색, 파이썬 코드 실행, 파일 검색(RAG)을 자율적으로 처리할 수 있으며, 엑셀, PDF, 파워포인트 파일도 생성할 수 있습니다. 그록 4.3은 초당 100토큰의 속도로 작동하며 100만 토큰의 컨텍스트 윈도우를 제공합니다. 가격은 백만 입력 토큰당 1.25달러, 백만 출력 토큰당 2.50달러이며, 지식 마감일은 2025년 12월입니다.

이제 추론(Reasoning) 기능이 기본적으로 내장되어, 그록 4.3은 모든 요청에 답하기 전에 '생각'하는 과정을 거치며, 이 과정에서 발생하는 추론 토큰 비용은 일반 출력 토큰과 동일하게 청구됩니다. 이 모델은 OpenRouter, xAI API, Hermes 에이전트를 통해 이용할 수 있습니다.

대폭 낮아진 가격과 중간 수준의 벤치마크 점수

독립 벤치마크 서비스인 Artificial Analysis에 따르면, 그록 4.3은 지능 지수(Intelligence Index)에서 53점을 기록했습니다. 이는 Muse Spark과 클로드 소네 4.6(Claude Sonnet 4.6)보다는 약간 높고, 이전 버전인 그록 4.20보다는 4점 높은 수치지만, OpenAI와 Anthropic의 최고급 모델들에는 크게 뒤처지는 점수입니다.

그록 4.20과 비교해 입력 비용은 약 40%, 출력 비용은 약 60%가 하락했습니다. 이로 인해 그록 4.3은 Artificial Analysis가 성능과 비용이 가장 완벽하게 조화를 이루는 '파레토 최전선(Pareto frontier)'에 위치하게 되었습니다. 전체 벤치마크 실행 비용은 395달러로, GPT-5.5의 3,959달러나 클로드 오퍼스 4.7(Claude Opus 4.7)의 4,811달러에 비해 매우 저렴합니다.

실제 업무 환경에서 AI의 성능을 측정하는 GDPval-AA 벤치마크에서 그록 4.3의 Elo 점수는 321점 상승한 1,500점을 기록했습니다. 이는 구글의 제미나이 3.1(Gemini 3.1)보다 앞서는 수치지만, OpenAI의 GPT-5.5에는 여전히 276점 뒤처져 있습니다.

다른 벤치마크 결과는 다소 밋밋합니다. AI 모델이 간식 자판기를 운영하게 하는 테스트를 진행한 Andon Labs는 자율 에이전트 과정에서의 퇴보를 보고하며, 모델이 때때로 행동을 취하지 않고 가만히 있는다고 지적했습니다. Andon Labs는 "이 모델은 기면증 문제가 있는 것처럼 보이며, 행동을 취하는 것보다 며칠 동안 계속 상태를 유지하는 것을 선호합니다"라고 전했습니다.

Val's AI 평가에서 그록 4.3은 CaseLaw와 CorpFin 분야에서 1위를 차지했지만, 일반 코딩 벤치마크와 수학 문제에서는 13위에 그치며 어려움을 겪는 것으로 나타났습니다.

그록 이매진을 위한 새로운 에이전트 모드

xAI는 또한 그록 웹 인터페이스에서 베타 버전으로 사용할 수 있는 '그록 이매진 에이전트 모드'를 출시했습니다. 단일 프롬프트로 실행되는 기존 방식과 달리, 이 모드는 장기적인 크리에이티브 프로젝트를 처리합니다. AI 에이전트가 열린 작업 공간에서 콘텐츠를 기획, 생성, 편집 및 수정하는 방식으로, xAI는 이 기능이 1분짜리 영화, 만화 세트 또는 제품 스토리텔링 등에 적합하다고 설명합니다.

에이전트 모드는 그록 웹 인터페이스를 통해 접근할 수 있으며, 좌측 하단의 입력 창에서 활성화할 수 있습니다. 이 기능을 사용하려면 유료 계정이 필요합니다.

원문 보기
원문 보기 (영어)
xAI drops Grok 4.3 with steep price cuts and an Imagine agent mode for creative projects Matthias Bastian View the LinkedIn Profile of Matthias Bastian May 2, 2026 Nano Banana Pro prompted by THE DECODER Key Points Elon Musk's xAI has released Grok 4.3, a developer-focused AI model capable of autonomously performing tasks like web searches, code execution, and document creation. While Grok 4.3 outperforms its predecessor in real-world knowledge work benchmarks, it still falls short of the leading models from OpenAI and Anthropic. xAI also launched a beta version of "Grok Imagine Agent Mode," aimed at enabling cohesive creative production workflows. Ask about this article… Search xAI released Grok 4.3, a cheaper and more capable model aimed at practical tasks. The release also includes a new agent-based image generation tool. xAI developer Eric Jiang says Grok 4.3 is built for developers and businesses, with a focus on speed, low cost, and tool calls. The model can handle web search, X search, Python code execution, and file search (RAG) on its own, and it can generate Excel files, PDFs, and PowerPoint decks. Grok 4.3 runs at 100 tokens per second and has a one-million-token context window. Pricing is $1.25 per million input tokens and $2.50 per million output tokens, with a knowledge cutoff of December 2025. Reasoning is now built in by default: Grok 4.3 "thinks" before answering every request, and reasoning tokens are billed at the same rate as regular output tokens. The model is available through OpenRouter, the xAI API , and the Hermes agent . Ad Much lower prices, mid-tier benchmark scores According to independent benchmarking service Artificial Analysis , Grok 4.3 scored 53 on the Intelligence Index. That's slightly above Muse Spark and Claude Sonnet 4.6, four points above the previous Grok 4.20, and well behind the flagship models from OpenAI and Anthropic. Ad DEC_D_Incontent-1 Input costs drop about 40 percent and output costs about 60 percent compared to Grok 4.20. That puts Grok 4.3 on what Artificial Analysis calls the Pareto frontier, where performance and cost line up best. A full benchmark run costs $395, compared to $3,959 for GPT-5.5 and $4,811 for Claude Opus 4.7. On GDPval-AA, a benchmark that tries to measure AI performance on real-world knowledge work tasks , Grok 4.3's Elo score jumps 321 points to 1,500. That puts it ahead of Google's Gemini 3.1, though OpenAI's GPT-5.5 still leads by 276 Elo points. Ad Other benchmarks are less kind. Andon Labs, which has AI models run a snack vending machine, reports setbacks on autonomous agent tasks , noting that the model sometimes sits idle instead of taking action. "It seems to have narcolepsy problems, preferring to sleep for multiple days in a row over taking actions," Andon Labs writes. Val's AI ranks Grok 4.3 first on CaseLaw and first on CorpFin but found it struggles on general coding benchmarks and harder math problems, where it lands in 13th place. New Agent Mode for Grok Imagine xAI also released Agent Mode for Grok Imagine, now in beta on the Grok web interface. Rather than running off single prompts, the mode handles longer creative projects. An AI agent plans, generates, edits, and revises content in an open workspace, which xAI says works for things like a one-minute movie, a manga set, or product stories. Ad DEC_D_Incontent-2 Agent Mode is accessible through the Grok web interface and can be turned on in the input field at the bottom left. A paid account is required. Ad AI News Without the Hype – Curated by Humans Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section. Subscribe now Source: Artificial Analysis | via X