메뉴
BL
The Decoder 11일 전

구글, 제니 모델과 스트리트뷰 결합…실제 장소 탐색 가능한 AI 세계 생성

IMP
8/10
핵심 요약

구글 딥마인드가 세계 모델 'Genie'를 스트리트뷰와 연동하여, 실제 지도 위에서 사용자가 상호작용할 수 있는 AI 가상 세계를 생성하는 기능을 공개했습니다. 이 시스템은 대중 소비용 게임보다는 자율주행차와 로봇 등 AI 에이전트를 학습시키기 위한 현실적인 시뮬레이션 훈련장으로 활용된다는 점에서 기술적 의의가 큽니다. 현재 미국 지역에 한해 구글 AI Ultra 구독자를 대상으로 실험적 프로토타입 형태로 제공되고 있습니다.

번역된 본문

원문 제목: Google pairs its Genie world model with Street View to create explorable AI worlds based on real places

Google Deepmind는 자사의 세계 모델(World model)인 'Genie(제니)'를 스트리트뷰(Street View) 이미지와 연동하여, 실제 장소를 기반으로 사용자가 인터랙티브하게 탐험할 수 있는 AI 생성 환경을 구축할 수 있게 했습니다.

핵심 요약: • Google Deepmind가 'Genie' 세계 모델을 스트리트뷰와 연동, 실제 장소 기반의 인터랙티브 AI 환경 생성 지원 • 구글의 방대한 스트리트뷰 데이터베이스는 경쟁사가 따라올 수 없는 강력한 우위를 제공 • 이 시스템은 주로 AI 에이전트, 로봇, 자율주행차를 위한 현실적인 훈련 환경으로 설계됨 • 구글 AI Ultra 구독자를 위한 실험적 프로토타입으로 출시되었으며, 현재 미국 지역으로 제한됨. 여전히 다소 거친 그래픽 한계가 보임

Google Deepmind는 자사의 세계 모델인 'Genie'를 스트리트뷰 이미지와 연결하여, 실제 위치에서 시작되는 인터랙티브 AI 환경을 생성할 수 있도록 했습니다. 사용자는 지도에 핀을 놓고, "Ocean World(해양 세계)", "Desert Sands(사막)", "Stone Age(석기 시대)", "B&W film(흑백 영화)"과 같은 스타일을 선택(선택 사항)한 뒤 캐릭터를 묘사할 수 있습니다. 이후 Genie 3는 실제 스트리트뷰 영상을 시작점으로 삼아 걸어 다닐 수 있는 세계를 구축합니다.

구글에 따르면 이 기능은 개발자들이 이미 스트리트뷰 데이터를 활용해 AI 기반 시각 자료를 생성하는 데 사용하는 인터페이스인 'Maps Imagery Grounding'에 의존합니다. 구글은 물에 잠긴 골든 게이트 브릿지와 1920년대 스타일로 꾸민 텍사스주 포트워스 스탁야즈 같은 데모를 통해 이 기술을 선보였습니다.

구글의 지도 데이터가 주는 압도적 우위 이번 발표의 진정한 핵심은 바로 '데이터'입니다. 구글은 수년에 걸쳐 도로, 건물 내부, 수로 및 외곽 지역의 스트리트뷰 이미지를 수집해 왔습니다. 이 방대한 라이브러리는 이제 생성형 세계를 구축하기 위한 훈련 데이터이자 기반으로 활용됩니다.

하지만 구글은 Genie를 주로 소비자용 제품으로 내세우고 있지는 않습니다. 이 세계 모델은 AI 에이전트와 로봇이 탐색하고, 추론하며, 학습할 수 있는 환경을 제공하기 위한 것입니다. 딥마인드의 에이전트인 SIMA 2는 이미 Genie를 훈련장으로 사용하고 있습니다. 또한 웨이모(Waymo)는 자율주행차를 위한 현실적인 거리 시나리오를 시뮬레이션하는 데 이를 활용하고 있습니다. 스트리트뷰와의 연동은 이러한 훈련이 특정 실제 위치에 맞춰 이루어질 수 있음을 의미합니다.

초기 데모, 기술 쇼케이스이자 게임 프리뷰의 혼합 구글의 전 AR/VR 및 3D 지도 제품 관리자였던 빌라왈 시두(Bilawal Sidhu)는 이 기능이 실제로 어떻게 작동하는지 보여주는 일련의 테스트 프롬프트를 게시했습니다. 그는 라스베이거스 스트립에서 구글 지도 브랜딩이 된 포뮬러 1 자동차를 몰고, 다람쥐로 변신해 스쿠터를 타고 예술의 전당(Palace of Fine Arts)을 지나가며, 보트를 타고 오스틴의 레이디 버드 호수를 건너고, 실내 스트리트뷰 데이터를 사용해 백악관을 걸어 다녔습니다.

이러한 예시는 다양한 활용성을 보여주는 동시에, 여전히 존재하는 기술적 한계도 함께 드러냅니다. 부드러워진 텍스처, 불안정한 기하학적 구조, 그리고 초현실적인 장면 전환 등이 눈에 띕니다.

이용 대상 및 남은 과제 스트리트뷰 연동 기능이 적용된 Project Genie는 전 세계 구글 AI Ultra 구독자(월 200달러, 18세 이상)에게 순차적으로 제공됩니다. 다만 실제 위치 기반 기능은 현재 미국 내 장소에서만 작동하며, 향후 지역을 확장할 계획입니다. 딥마인드 자체도 이를 '실험용 연구 프로토타입'이라 부르며, 팀이 더 나은 버전을 개발 중이라고 밝혔습니다.

원문 보기
원문 보기 (영어)
Google pairs its Genie world model with Street View to create explorable AI worlds based on real places Maximilian Schreiner View the LinkedIn Profile of Maximilian Schreiner May 20, 2026 Google Deepmind Key Points Google Deepmind connects its Genie world model to Street View imagery, letting users create interactive, AI-generated environments based on real places. Google's massive Street View database gives it an edge no competitor can match. The system is primarily designed as a realistic training ground for AI agents, robots, and self-driving cars. The feature launches as an experimental prototype for Google AI Ultra subscribers, is limited to U.S. locations for now, and still shows visible graphical rough edges. Ask about this article… Search Google Deepmind is connecting its Genie world model to Street View imagery, letting users generate interactive, AI-built environments that start from an actual location. Users drop a pin on a map, pick an optional style like "Ocean World," "Desert Sands," "Stone Age," or "B&W film," and describe a character. Genie 3 then builds a walkable world whose starting point is tied to real Street View footage. Google says the feature relies on "Maps Imagery Grounding," an interface developers already use to create AI-powered visuals from Street View data. The company shows off the tech with demos like a flooded Golden Gate Bridge and the Fort Worth Stockyards in Texas styled after the 1920s. Ad Google's map data gives it an edge no competitor can match The real story here is the data. Google has spent years collecting Street View imagery of roads, building interiors, waterways, and remote areas. That library now serves as both training material and an anchor for generative worlds. Ad DEC_D_Incontent-1 Google isn't pitching Genie mainly as a consumer product, though. The world model is meant to give AI agents and robots an environment where they can navigate, reason, and learn. Deepmind's agent SIMA 2 already uses Genie as a training ground. Waymo, meanwhile, uses it to simulate realistic street scenarios for self-driving cars. The Street View connection means these training runs can now be pinned to specific real-world locations. Early demos look like a mix of tech showcase and game preview Bilawal Sidhu , a former Google product manager for AR/VR and 3D Maps, posted a string of test prompts that show what this looks like in practice. He races a Google Maps-branded Formula 1 car down the Las Vegas Strip, rides past the Palace of Fine Arts as a squirrel on a scooter, steers a boat across Austin's Lady Bird Lake, and walks through the White House using indoor Street View data. Ad Woot! You can now simulate real world places by grounding Genie 3 experiences with Street View imagery. Google sitting on the mother lode of real world data, and is starting to put it to work! Ad DEC_D_Incontent-2 Let's dive into some prompts & locations I tested... pic.twitter.com/TlXSWNx08h Ad - Bilawal Sidhu (@bilawalsidhu) May 19, 2026 The examples show the range but also the rough edges that are still visible: soft textures, unstable geometry, and surreal transitions. Who gets access, and what's still missing Project Genie with Street View grounding is rolling out globally to Google AI Ultra subscribers ($200 per month, 18+). The real-world location feature only works for U.S. spots for now, with plans to expand. Deepmind itself calls this an experimental research prototype and says the team is working on a better version. AI News Without the Hype – Curated by Humans Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section. Subscribe now Source: Google