메뉴
BL
Wired AI 11일 전

구글의 24시간 AI 에이전트 '스파크' 공개

IMP
8/10
핵심 요약

구글이 올해 I/O 개발자 컨퍼런스에서 사용자의 모든 개인정보를 숙지하고 주도적으로 작업을 수행하는 24시간 AI 어시스턴트 에이전트 '제미나이 스파크(Gemini Spark)'를 발표했습니다. 이 에이전트는 사용자가 개입하지 않는 동안에도 능동적으로 이메일과 일정 등을 분석해 처리하며, 향후 타사 앱 연동 및 문자 명령 기능도 지원할 예정입니다. 월 100달러 이상의 프리미엄 구독자를 대상으로 베타 버전이 순차적으로 공개되는 이 혁신적인 에이전트는 높은 편의성을 제공하지만, 개인 데이터 제어권과 오작동 리스크 관리가 핵심 과제로 떠오르고 있습니다.

번역된 본문

제미나이 스파크(Gemini Spark)는 사용자의 모든 정보를 꿰뚫고 있는 강력한 AI 어시스턴트 에이전트에 대한 구글의 답안입니다. 올해 구글 I/O 개발자 컨퍼런스에서 발표된 이 기능은 제미나이 챗봇 앱 업데이트의 일환으로 소개되었습니다.

소프트웨어 기업들이 AI 에이전트에 대해 한동안 화려하게 떠들어 왔지만, 작년 1월에 Anthropic의 Claude Cowork(Claude 컴퓨터 사용 기능)를 직접 체험해 보기 전까지는 별로 감흥이 없었습니다. 단 한 번의 클릭도 없이 내 바탕화면에 흩어져 있던 스크린샷들을 봇이 알아서 라벨이 지정된 폴더로 정리하는 것을 지켜보며, 이것이 사람과 컴퓨터가 상호작용하는 방식의 전환점이 될 수 있겠다는 확신이 들었습니다. 올해 초 샌프란시스코의 많은 얼리 어답터들 역시 단순히 몇 가지 작업을 도와주는 수준을 넘어 자신의 모든 온라인 삶을 관리해 주기 바라며 초바이럴이 된 OpenClaw(참고: 최근 개발된 범용 AI 에이전트) 봇을 세팅하며 비슷한 경험을 했습니다. 파워 유저들은 OpenClaw를 통해 받은 편지함, 캘린더, 문자 메시지를 완전히 자동화하려고 시도했고, 심지어 자판기를 운영하는 데에도 (성공 여부는 다양했지만) 사용했습니다. 물론 리스크가 없는 것은 아닙니다. 이러한 에이전트에게 데이터와 컴퓨터의 제어권을 넘겨주어야 하는데, 한 메타(Meta) 직원이 실험 중이었던 OpenClaw는 해당 사용자의 이메일 보관함 전체를 거의 삭제할 뻔하기도 했습니다.

Google 캘린더를 통한 일일 일정이나 Gmail 예약 확인을 통한 저녁 데이트 장소 파악 등, 제미나이 스파크는 서드파티 앱과 연결하기도 전에 사용자의 개인 정보라는 깊은 우물을 깊이 파고들 수 있습니다. 기존 제미나이 앱으로도 동일한 작업의 대부분을 수행할 수 있지만, 스파크의 차별점은 사용자가 프롬프트를 입력하기를 기다리는 대신, 사용자가 자리를 비운 사이에도 능동적으로 세부 사항을 수집하고 조치를 취한다는 것입니다.

구글은 제미나이 스파크를 이전에 수동으로 처리하거나 다른 앱에서 진행하던 작업들을 한 번에 해결할 수 있는 원스톱 솔루션으로 자리매김하고 있습니다. 이 에이전트는 신용카드 명세서를 정기적으로 살펴보고 예상치 못한 청구 금액에 플래그를 달아줍니다. (RocketMoney 앱, 더 이상 당신은 필요 없을 것 같습니다.) 또한 유치원에 다니는 아이에 관한 모든 이메일을 훑어보고 주요 일정을 강조하여 아침 요약 보고서를 자동으로 작성하도록 설정할 수도 있습니다. 모든 회의록을 스파크에 넘겨주고 구글 문서(Doc) 초안을 작성하거나 적절한 담당자에게 후속 이메일을 발송하도록 요청할 수도 있습니다.

이 에이전트는 점진적으로 도입되어 이번 주 소규모 얼리 테스터 그룹에게 먼저 공개되며, 내년 주부터 구글의 월 100달러 이상 AI 요금제 구독자를 대상으로 베타 버전이 출시될 예정입니다. 스파크를 가장 먼저 사용해 보기 위해서는 꽤 비싼 비용을 지불해야 합니다! 구글은 향후 몇 주 내에 OpenTable과 Instacart 같은 서드파티 앱에 추가적인 자동화 기회를 제공하기 위해 스파크를 제미나이를 통해 연결할 수 있도록 허용할 계획입니다. 스파크 로드맵에 임박한 다른 기능으로는 에이전트가 로컬 브라우저를 조작할 수 있도록 허용하는 것과 에이전트에게 문자나 이메일로 명령을 내리는 기능 등이 포함됩니다.

에이전트에게 문자로 명령을 내릴 수 있다는 점은 스파크 경험을 매끄럽게 만드는 데 핵심적인 요소가 될 것입니다. 제미나이 앱을 열다가 다른 것에 정신을 빼앗기는 대신, 마치 영화 <악마는 프라다를 입는다>에 나오는 어시스턴트 '안드레아'인 양 하루 종일 스파크에게 점점 더 구체적이고 까다로운 요청을 문자로 보내게 될 것 같습니다.

이러한 에이전트를 사용할 때 성공 여부를 가늠하는 주요 기준 중 하나는 에이전트가 얼마나 자주 통제를 잃고 오작동하느냐는 것입니다. 구글의 에이전트 관련 발표 블로그에 따르면 "스파크는 사용자의 지시 아래 작동합니다. 사용자가 기능을 켤지, 어떤 앱에 연결할지 선택하며, 돈을 쓰거나 이메일을 보내는 것과 같은 고위험 작업을 수행하기 전에 항상 먼저 사용자에게 묻도록 설계되었습니다." 이 도구를 사용하는 사람은 개인 데이터를 기반으로 구동되는 실험용 소프트웨어를 사용함으로써 위험을 감수하는 것입니다. 구글은 스파크가 준수할 지출 한도 및 선호하는 판매자를 사용자가 설정할 수 있도록 자동 쇼핑 기능을 확장할 계획이지만, 각별한 주의가 필수적입니다.

구글 랩스(Google Labs) 부사장이자 제미나이 앱 총괄인 조시 우드워드(Josh Woodward)는 "우리는 이를 십대에게 첫 직불 카드를 주는 것과 같다고 생각합니다."라고 말합니다. 이는 사용자가 앱을 열고 따로 학습할 필요 없이 자동화된 에이전트 작업을 검색 결과에 직접적으로 가져오는 구글의 검색(Search) 변화와도 매우 흡사합니다.

원문 보기
원문 보기 (영어)
Comment Loader Save Story Save this story Comment Loader Save Story Save this story Gemini Spark is Google’s take on a steroided-out assistant agent that knows everything about you, announced as part of the company’s updates to its Gemini chatbot app at this year’s I/O developer conference . Software companies have been talking up AI agents for some time now, but I wasn’t impressed until I tried Anthropic’s Claude Cowork in January. I sat back as the bot organized the scattered screenshots littering my desktop into labeled folders without a single click, and felt convinced that this might be a turning point for how people interact with their computers. Many other early adopters in San Francisco experienced similar moments when they set up the mega-viral OpenClaw bot earlier this year, not just to help complete a few tasks but to run their whole online lives. Power users attempted to fully automate their inboxes, calendars, and text messages, and even run a vending machine to varying levels of success via OpenClaw. It’s not without risks—you have to give these agents control of your data and computer, and OpenClaw almost deleted an entire trove of emails for one Meta employee who was experimenting with it Whether it&#x27;s my daily schedule via Google Calendar or my date-night dinner spots through Gmail confirmations, Gemini Spark can dive deep into the well of my personal info before I even connect to a third-party integration. While the standard Gemini app can complete many of the same tasks, Sparks’ differentiator is that it proactively gathers details and takes action while you’re away, rather than waiting for you to prompt it. Google pitches Gemini Spark as a one-stop shop for completing tasks people previously handled manually or did in other apps. The agent can look through your credit card bill regularly to flag surprise fees—sorry, RocketMoney app , won’t be needing you anymore. Spark can be calibrated to automatically skim every email about your preschooler and highlight key dates for a morning digest report. You can even throw all your meeting notes at Spark and ask it to draft a Google Doc and generate follow-up emails to the right people. This agent is getting a slow rollout, arriving for a small group of early testers this week and launching next week in beta for subscribers to Google’s $100+ per month AI plan. It’s pricey to be one of the first people to experiment with Spark! The company plans to allow Spark to connect through Gemini to third-party apps, like OpenTable and Instacart, for additional automation opportunities in the coming weeks. Other features imminent on the Spark road map include allowing the agent to manipulate your local browser and the ability to text or email commands to the agent. Being able to text commands to your agent sounds like a key factor in actually making the Spark experience feel seamless. Rather than opening the Gemini app and getting distracted, I’ll spend all day texting Spark my increasingly niche requests, as if it were assistant Andrea from The Devil Wears Prada . One of the main measures of success when trying this agent will be how often it goes off the rails. “Spark operates under your direction,” reads Google’s announcement blog about the agent. “You choose whether to turn it on and what apps it connects to, and it’s designed to ask you first before performing high-stakes actions like spending money or sending emails.” Anyone who tries the tool is taking a risk by using experimental software that’s powered by personal data. Google plans to expand the agentic shopping feature to allow users to set spending limits and preferred merchants that Spark will adhere to, though exercising caution is critical. “We think of it as if you&#x27;re giving a teenager their first debit card,” says Josh Woodward, vice president of Google Labs and the head of the Gemini app. Much like the changes Google is implementing in Search, which brings agentic task automation without needing to leave the search experience, Spark is Google’s chance to push AI agents further into the public zeitgeist. Let’s see if it has the necessary spark to pull it off.