메뉴
BL
MIT Tech Review 60일 전

휴머노이드 로봇을 훈련시키는 긱 워커들

IMP
8/10
핵심 요약

테슬라, 피겨 AI 등 휴머노이드 로봇 개발 경쟁이 격화되면서, 실제 인간의 움직임 데이터를 수집하는 긱 워커들의 수요가 급증하고 있습니다. 이들은 스마트폰을 이용해 빨래 개기나 청소 등의 일상 동작을 촬영하여 로봇 학습용 데이터를 제공하며, 이 과정에서 프라이버시와 저작권 등 새로운 이슈도 대두되고 있습니다.

번역된 본문

나이지리아 중부의 언덕 꼭대기 도시에 사는 의대생 제우스(Zeus)가 긴 하루의 병원 일과를 마치고 스튜디오 아파트로 돌아오면, 그는 링 조명을 켜고 아이폰을 이마에 고정한 채 자신을 촬영하기 시작합니다. 그는 마치 몽유병 환자처럼 손을 앞으로 들어 올리고 침대에 시트를 깝니다. 카메라 프레임 안에 손이 계속 유지되도록 매우 천천히 그리고 조심스럽게 움직입니다. 제우스는 미국 캘리포니아주 팔로알토에 본사를 둔 기업 마이크로원(Micro1)의 데이터 레코더입니다. 이 회사는 로봇 공학 기업에 판매할 실제 현실의 데이터를 수집합니다.

테슬라(Tesla), 피겨 AI(Figure AI), 어질리티 로보틱스(Agility Robotics) 같은 기업들이 공장과 가정에서 인간처럼 보이고 움직이도록 설계된 로봇인 휴머노이드를 구축하기 위해 경쟁하면서, 제우스 같은 긱 워커들이 촬영한 영상이 이를 훈련시키는 가장 인기 있는 새로운 방법이 되었습니다. 마이크로원은 인도, 나이지리아, 아르헨티나 등 기술에 능통한 젊은이들이 일자리를 찾고 있는 50개국 이상에서 수천 명의 계약직 근로자를 고용했습니다. 그들은 아이폰을 머리에 장착하고 빨래 개기, 설거지, 요리하는 자신의 모습을 촬영합니다. 이 일은 현지 기준으로 급여가 좋고 지역 경제를 활성화하지만, 프라이버시와 사전 동의에 대한 까다로운 질문을 제기합니다. 그리고 이 작업은 때때로 어렵고 이상할 수 있습니다.

제우스는 작년 11월에 링크드인(LinkedIn)과 유튜브(YouTube)에서 사람들이 이 일에 대해 널리 이야기하기 시작하면서 이 일자리를 찾았습니다. 그는 "이것은 미래에 로봇을 훈련시키는 데 사용될 데이터를 제공하고, 중요한 발자취를 남길 수 있는 정말 좋은 기회가 될 것"이라고 생각했습니다. 제우스는 시간당 15달러를 받는데, 이는 높은 실업률을 기록하는 나이지리아의 어려운 경제 상황에서 좋은 수입입니다. 하지만 의사가 되기를 꿈꾸는 총명한 학생인 그는 매일 몇 시간씩 옷을 다림질하는 것이 지루하다고 느낍니다. "저는 이 일을 그다지 좋아하지 않아요"라고 그는 말합니다. "저는 생각이 필요한 기술적인 일을 원하는 사람입니다."

제우스를 포함해 MIT 테크놀로지 리뷰(MIT Technology Review)와 인터뷰한 모든 근로자는 자신의 업무에 대해 이야기할 권한이 부여되지 않았기 때문에 가명으로만 불러달라고 요청했습니다.

휴머노이드 로봇은 물리적 객체를 조작하는 것이 마스터하기 어려운 기술이기 때문에 구축하기가 악명 높게 어렵습니다. 하지만 챗GPT(ChatGPT) 같은 챗봇의 기반이 되는 대형 언어 모델의 부상은 로봇 공학에 패러다임의 전환을 불러일으켰습니다. 대형 언어 모델이 인터넷에서 수집한 방대한 텍스트로 훈련되어 단어를 생성하는 법을 배운 것처럼, 많은 연구자들이 휴머노이드 로봇도 방대한 양의 움직임 데이터로 훈련받으면서 세상과 상호작용하는 법을 배울 수 있다고 믿습니다.

(편집자 주: 최근 실시된 여론 조사에서 MIT 테크놀로지 리뷰 독자들은 휴머노이드 로봇을 2026년 10대 돌파 기술(10 Breakthrough Technologies) 목록의 11번째 돌파구로 선정했습니다.)

하지만 로봇 공학은 물리적 세계에 대한 훨씬 더 복잡한 데이터를 필요로 하며, 이를 찾기는 훨씬 더 어렵습니다. 가상 시뮬레이션은 로봇에게 곡예를 수행하도록 훈련시킬 수는 있지만, 물건을 잡고 움직이는 방법은 가르칠 수 없습니다. 왜냐하면 시뮬레이션은 물리학을 완벽하게 정확하게 모델링하는 데 한계가 있기 때문입니다. 로봇이 공장에서 일하고 가사 도우미 역할을 하려면 수집하는 데 시간과 비용이 많이 들더라도 실제 현실의 데이터가 필요할 수 있습니다.

투자자들은 이러한 과제를 해결하기 위해 열광적으로 자금을 쏟아붓고 있으며, 2025년 한 해만 휴머노이드 로봇에 60억 달러 이상을 지출하고 있습니다. 그리고 가정 내 데이터 레코딩은 전 세계적으로 급성장하는 긱 경제(Gig economy)가 되고 있습니다. 스케일 AI(Scale AI)와 엔코드(Encord) 같은 데이터 기업들은 자체적인 데이터 레코더 대군을 모집하고 있으며, 도어대시(DoorDash)는 배달 기사들에게 집안일을 하는 모습을 촬영하도록 돈을 지불하고 있습니다. 그리고 중국에서는 수십 개의 국영 로봇 훈련 센터 근로자들이 가상 현실(VR) 헤드셋과 외골격을 착용하고 휴머노이드 로봇에게 전자레인지를 열고 테이블을 닦는 방법을 가르치고 있습니다.

"수요가 엄청나고, 정말 빠르게 증가하고 있습니다"라고 마이크로원의 CEO 알리 안사리(Ali Ansari)는 말합니다. 그는 로봇 공학 기업들이 현재 자사 및 유사 기업들로부터 실제 현실 데이터를 구매하기 위해 매년 1억 달러 이상을 지출하고 있다고 추정합니다.

일상의 하루 마이크로원의 근로자들은 자라(Zara)라는 이름의 AI 에이전트가 진행하는 인터뷰와 샘플 검토를 통해 검증됩니다.

원문 보기
원문 보기 (영어)
When Zeus, a medical student living in a hilltop city in central Nigeria, returns to his studio apartment from a long day at the hospital, he turns on his ring light, straps his iPhone to his forehead, and starts recording himself. He raises his hands in front of him like a sleepwalker and puts a sheet on his bed. He moves slowly and carefully to make sure his hands stay within the camera frame. Zeus is a data recorder for Micro1, a US company based in Palo Alto, California that collects real-world data to sell to robotics companies. As companies like Tesla, Figure AI, and Agility Robotics race to build humanoids —robots designed to resemble and move like humans in factories and homes—videos recorded by gig workers like Zeus are becoming the hottest new way to train them. Micro1 has hired thousands of contract workers in more than 50 countries, including India, Nigeria, and Argentina, where swathes of tech-savvy young people are looking for jobs. They’re mounting iPhones on their heads and recording themselves folding laundry, washing dishes, and cooking. The job pays well by local standards and is boosting local economies, but it raises thorny questions around privacy and informed consent. And the work can be challenging at times—and weird. Zeus found the job in November, when people started talking about it everywhere on LinkedIn and YouTube. “This would be a real nice opportunity to set a mark and give data that will be used to train robots in the future,” he thought. Zeus is paid $15 an hour, which is good income in Nigeria’s strained economy with high unemployment rates. But as a bright-eyed student dreaming of becoming a doctor, he finds ironing his clothes for hours every day boring. “I really [do] not like it so much,” he says. “I’m the kind of person that requires … a technical job that requires me to think.” Zeus, and all the workers interviewed by MIT Technology Review , asked to be referred to only by pseudonyms because they were not authorized to talk about their work. Humanoid robots are notoriously hard to build because manipulating physical objects is a difficult skill to master. But the rise of large language models underlying chatbots like ChatGPT has inspired a paradigm shift in robotics. Just as large language models learned to generate words by being trained on vast troves of text scraped from the internet, many researchers believe that humanoid robots can learn to interact with the world by being trained on massive amounts of movement data. Editor’s note: In a recent poll, MIT Technology Review readers selected humanoid robots as the 11th breakthrough for our 2026 list of 10 Breakthrough Technologies . Robotics requires far more complex data about the physical world, though, and that is much harder to find. Virtual simulations can train robots to perform acrobatics , but not how to grasp and move objects, because simulations struggle to model physics with perfect accuracy. For robots to work in factories and serve as housekeepers, real-world data, however time-consuming and expensive to collect, may be what we need. Investors are pouring money feverishly into solving this challenge, spending over $6 billion on humanoid robots in 2025. And at-home data recording is becoming a booming gig economy around the world. Data companies like Scale AI and Encord are recruiting their own armies of data recorders, while DoorDash pays delivery drivers to film themselves doing chores. And in China, workers in dozens of state-owned robot training centers wear virtual-reality headsets and exoskeletons to teach humanoid robots how to open a microwave and wipe down the table. “There is a lot of demand, and it’s increasing really fast,” says Ali Ansari, CEO of Micro1. He estimates that robotics companies are now spending more than $100 million each year to buy real-world data from his company and others like it. A day in the life Workers at Micro1 are vetted by an AI agent named Zara that conducts interviews and reviews samples of chore videos. Every week, they submit videos of themselves doing chores around their homes, following a list of instructions about things like keeping their hands visible and moving at natural speed. The videos are reviewed by both AI and a human and are either accepted or rejected. They’re then annotated by AI and a team of hundreds of humans who label the actions in the footage. Because this approach to training robots is in its infancy, it’s not clear yet what makes good training data. Still, “you need to give lots and lots of variations for the robot to generalize well for basic navigation and manipulation of the world,” says Ansari. But many workers say that creating a variety of “chore content” in their tiny homes is a challenge. Zeus, a scrappy student living in a humble studio, struggles to record anything beyond ironing his clothes every day. Arjun, a tutor in Delhi, India, takes an hour to make a 15-minute video because he spends so much time brainstorming new chores. “How much content [can be made] in the home? How much content?” he says. There’s also the sticky question of privacy. Micro1 asks workers not to show their faces to the camera or reveal personal information such as names, phone numbers, and birth dates. Then it uses AI and human reviewers to remove anything that slips through. But even without faces, the videos capture an intimate slice of workers’ lives: the interiors of their homes, their possessions, their routines. And understanding what kind of personal information they might be recording while they’re busy doing chores on camera can be tricky. Reviews of such footage might not filter out sensitive information beyond the most obvious identifiers. For workers with families, keeping private life off camera is a constant negotiation. Arjun, a father of two daughters, has to wrangle his chaotic two-year-old out of frame. “Sometimes it’s very difficult to work because my daughter is small,” he says. Sasha, a banker turned data recorder in Nigeria, tiptoes around when she hangs her laundry outside in a shared residential compound so she won’t record her neighbors, who watch her in bewilderment. While the workers interviewed by MIT Technology Review understand that their data is being used to train robots, none of them know how exactly their data will be used, stored, and shared with third parties, including the robotics companies that Micro1 is selling the data to. For confidentiality reasons, says Ansari, Micro1 doesn’t name its clients or disclose to workers the specific nature of the projects they are contributing to. “It is important that if workers are engaging in this, that they are informed by the companies themselves of the intention … where this kind of technology might go and how that might affect them longer term,” says Yasmine Kotturi, a professor of human-centered computing at the University of Maryland. Occasionally, some workers say, they’ve seen other workers asking on the company Slack channel if the company could delete their data. Micro1 declined to comment on whether such data is deleted. “People are opting into doing this,” says Ansari. “They could stop the work at any time.” Hungry for data With thousands of workers doing their chores differently in different homes, some roboticists wonder if the data collected from them is reliable enough to train robots safely. “How we conduct our lives in our homes is not always right from a safety point of view,” says Aaron Prather, a roboticist at ASTM International. “If those folks are teaching those bad habits that could lead to an incident, then that’s not good data.” And the sheer volume of data being collected makes reviewing it for quality control challenging. But Ansari says the company rejects videos showing unsafe ways of performing a task, while clumsy movements can be useful to teach robots what not to do. Then there’s the question of how much of this data we need. Micro1 says it has tens of thousands of hours of footage, whil