머스크, xAI가 OpenAI 모델 활용해 학습 인정
일론 머스크가 캘리포니아 연방 법정에서 xAI의 AI 모델 '그록(Grok)'을 학습시키는 과정에서 OpenAI 모델을 활용하는 디스틸레이션(증류) 기법을 사용했음을 부분적으로 인정했습니다. 이는 막대한 인프라 투자로 확보한 선도 기업의 우위를 저렴한 비용으로 무너뜨릴 수 있어 AI 업계의 핵심 쟁점으로 떠오르는 기술입니다. 현재 OpenAI, 구글 등은 중국 기업들의 무단 디스틸레이션을 막기 위해 보안 조치를 강화하고 있으며, 이번 발언은 미국 내 기업들 역시 경쟁사 모델을 적극 활용하고 있음을 시사합니다.
최근 OpenAI와 Anthropic은 공개적으로 접근 가능한 챗봇과 API에 프롬프트를 입력해 새로운 AI 모델을 학습시키는 제3자의 시도에 대해 강력히 대응하고 있습니다. 이러한 과정은 업계에서 '디스틸레이션(증류, distillation)'으로 불립니다. 이 논의는 주로 중국 기업들이 디스틸레이션을 사용해 미국 기업의 수준과 맞먹으면서도 비용은 훨씬 저렴한 오픈 웨이트(open-weight) 모델을 만드는 데 초점이 맞춰져 있었습니다. 하지만 기술 업계 종사자들은 미국 기업들 역시 경쟁에서 뒤처지지 않기 위해 서로의 기술을 이런 방식으로 사용할 것이라고 폭넓게 추측해 왔습니다.
이제 적어도 한 가지 사례에서 이것이 사실로 확인되었습니다. 목요일 캘리포니아 연방 법정에 선 일론 머스크는 xAI가 Grok을 학습시키기 위해 OpenAI 모델에 디스틸레이션 기법을 사용했는지에 대한 질문을 받았으며, 그는 이것이 AI 기업들 사이에서 일반적인 관행이라고 주장했습니다. 그것이 "그렇다"는 의미냐는 추가 질문에 그는 "부분적으로 그렇다(Partly)"고 답했습니다.
머스크는 현재 OpenAI와 CEO 샘 알트만, 그렉 브록만을 상대로 소송을 진행 중이며, 그들이 OpenAI의 본래 비영리 미션을 위배하고 영리 구조로 전환했다고 주장하고 있습니다. 이번 주 시작된 이 재판에서 이 기업 리더의 증언이 이루어졌습니다.
머스크의 이번 인정은 주목할 만합니다. 왜냐하면 디스틸레이션은 막대한 컴퓨팅 인프라에 투자하여 구축한 AI 거인들의 강점을 훼손함으로써 그들을 위협하기 때문입니다. 이 기술을 이용하면 다른 소프트웨어 개발자들도 적은 비용으로 거의 동등한 수준의 모델을 만들어낼 수 있습니다.
최첨단 AI 연구소(frontier labs)들이 모델을 학습시키기에 충분한 데이터를 찾는 과정에서 저작권 규정을 구부리거나 위반했다는 비난을 받아온 점을 생각해보면 이 상황은 적지 않은 아이러니입니다. OpenAI보다 몇 년 늦은 2023년에 설립된 머스크의 xAI가 당시 업계 선두주자로부터 무언가를 배우려고 시도했다는 것은 전혀 놀라운 일이 아닙니다.
디스틸레이션이 명백히 불법인지는 확실하지 않지만, 대신 기업들이 자사 제품 사용자에게 설정한 서비스 약관을 위반할 수는 있습니다. 보도에 따르면 OpenAI, Anthropic, 구글은 Frontier Model Forum을 통해 중국의 디스틸레이션 시도를 방지하는 방법에 대한 정보를 공유하기 위한 이니셔티브를 시작했습니다. 이러한 시도는 일반적으로 모델의 내부 작동 원리를 이해하기 위해 체계적으로 쿼리(질의)를 보내는 방식으로 이루어집니다. 이러한 노력을 막기 위해 최첨단 연구소들은 사용자가 의심스러운 대량 쿼리를 하는 것을 방지하기 위해 노력하고 있습니다.
보도 시점에서 OpenAI는 머스크의 인정에 대한 코멘트 요청에 응답하지 않았습니다.
증언 후반부에서 머스크는 작년 여름 xAI가 곧 구글을 제외한 어떤 기업보다도 훨씬 앞서갈 것이라고 주장했던 발언에 대해 질문을 받았습니다. 이에 대해 그는 세계적인 AI 제공업체들의 순위를 매리며 Anthropic이 1위, 그 뒤를 이어 OpenAI, 구글, 중국 오픈소스 모델들이라고 말했습니다. 그는 xAI를 단지 수백 명의 직원을 가진 훨씬 작은 회사라고 특징지었습니다.