메뉴
BL
r/singularity 16일 전

원격 조종이라는 주장에 대한 반박: 휴머노이드 AI의 진화

IMP
8/10
핵심 요약

최근 공개된 휴머노이드 로봇의 행동이 사람의 원격 조종(Teleoperation)이 아니라 자율적인 판단에 의한 것이라는 주장이 제기되었습니다. 저자는 2010년대 로봇 기술과 달리 현재 기술은 실시간으로 시각 정보를 처리하고 행동을 생성하는 '물리적 AI(Physical AI)'의 탄생을 의미한다고 강조합니다. 이는 단순한 텍스트 기반 지능을 넘어 실제 세계에서 작동하는 AI의 중요한 진전으로 평가됩니다.

번역된 본문

또한 그 움직임은 전혀 사람 같지 않습니다. 어떤 사람이 한 팔을 완전히 가만히 둔 채로 다른 팔로 멀리 있는 물건을 잡으려 하겠습니까? (몸의 움직임을 제외하고, 팔꿈치 각도조차 변하지 않습니다.)

사람들은 현실을 부정하고, 이것이 인도에 있는 누군가가 조종하는 것이라고 믿고 싶어 하는 것 같습니다. 자동차나 아이폰처럼 휴머노이드가 급부상할 날에 대한 준비가 되어 있지 않기 때문입니다. 이는 잠재적으로 우리가 본 것 중 가장 파괴적인 기술이 될 수 있습니다.

수정

이 서브레딧의 사람들: "사실 원격 조종(Teleop)이야!"

그것이 아니라고 보여준 후: "이건 쓰레기고 좋지 않아. AGI도 아니고, 구식 기술처럼 보여."

아직 AGI가 아니라는 데는 동의하지만 제 말을 들어보세요. 움직임이 사람처럼 보여 원격 조종이라고 믿으면서, 동시에 이런 것은 10년 전에도 할 수 있었다고 믿는 것은 매우 모순적입니다.

2010년대 로봇은 기본적인 작업이나 작업 세트 이상으로 일반화할 수 없었다는 것을 이해해야 합니다. 이것을 설명해야 한다는 것은 부끄러운 일입니다. 픽셀과 프롬프트에서 실시간으로 행동을 생성하는 기술의 전례는 없습니다.

몇 년 전만 해도 우리는 제한된 이미지 이해能力을 가진 텍스트 기반 지능에 국한되어 있었습니다. 그것은 실제 세계에서 아무것도 할 수 없었기 때문에 많은 비평가들이 AGI에 가깝지 않다고 주장했습니다. 여러분은 문자 그대로 물리적 AI(Physical AI)의 탄생을 보고 있으면서도 전혀 신경 쓰지 않습니다. 어쩌면 자기 기만이거나, 어쩌면 놀라운 호기심 부족이지만, 자발적으로 '특이점(Singularity)'이라는 서브레딧에 오는 사람답지 않은 태도입니다.

원문 보기
원문 보기 (영어)
Also the movement doesn't look human to me at all, what human is trying to reach for something far away with one arm while keeping the other one completely still (outside of body movement, but the elbow angle doesn't change). I think people are in denial and really want to believe this is a guy in India controlling it because they're not ready for the day that humanoids take off like the automobile or the iPhone because it's potentially the most disruptive technology we've seen. EDIT People in this subreddit: "It's actually teleoperated!" After showing them it's not: "This is actually shit and not good. Not even AGI, looks like dated tech." Agree that it's not AGI yet but hear me out. Pretty inconsistent to believe the movements look human enough to imply teleoperation but then believe that this is something we could do 10 years ago. You have to understand that robots of the 2010s could not generalize beyond a basic task or set of tasks. It is embarrassing this has to be explained. There is no precedent for technology that generates actions from pixels and prompts in real time. A couple years ago we were limited to text based intelligence with limited image understanding. It couldn't do \*anything\* in the real world which is why a lot of critics claimed it wasn't close to being AGI. You are literally watching the birth of physical AI and don't care even a little bit. Maybe it is cope, maybe it is a stunning lack of curiosity, but it seems uncharacteristic of anyone who willingly comes to a subreddit called "singularity."