AI 과대광고와 실제 수익 사이의 빈칸
현재 AI 산업은 기술을 구축하고 혁신을 약속하지만, 그 목표를 어떻게 달성할지에 대한 구체적인 실행 방안(2단계)이 부족한 상태입니다. 최근 연구들은 AI가 여전히 복잡한 실무 작업에서 한계를 보이며, 기존의 업무 프로세스와 결합하는 과정에서 오히려 효율성을 떨어뜨릴 수 있음을 지적합니다. 이는 AI에 대한 맹목적인 기대를 경계하고 실질적인 작업 환경 내 AI 통합 전략을 고민해야 함을 시사합니다.
이 기사는 처음에 우리의 주간 AI 뉴스레터인 The Algorithm에 실렸습니다. 이와 같은 기사를 가장 먼저 받아보려면 여기에서 가입하세요. 2월, 저는 런던에서 열린 반(Anti) AI 시위에서 전단지를 하나 주웠습니다. 이 전단지를 만든 사람들이 사우스파크(South Park)의 '양말 도둑 노움(Underpants Gnomes)' 에피소드를 패러디하려 했는지는 확실하지 않습니다. 하지만 그랬다면 정확히 맞아떨어지는 훌륭한 패러디였습니다. 전단지에는 이렇게 적혀 있었습니다. "1단계: 디지털 초지능을 키운다. 2단계: ? 3단계: ?" 시위 공동 주최 단체인 국제 활동가 그룹 'Pause AI'가 제작한 이 전단지는 독자들에게 이렇게 호소하며 끝을 맺었습니다. "2단계가 대체 뭔지 알기 전까지 AI를 일시 중단하라."
1998년에 처음 방영된 사우스파크의 '노움(Gnomes)' 에피소드에서 케니, 카일, 카트만, 스탠은 밤마다 몰래 서랍에서 속옷을 훔치는 노움 마을을 발견합니다. 이유가 뭘까요? 노움들은 자신들의 사업 계획서(피치덱)를 이렇게 발표합니다. "1단계: 속옷을 수집한다. 2단계: ? 3단계: 막대한 수익을 창출한다."
이 노움들의 사업 계획은 스타트업 전략부터 정책 제안에 이르기까지 모든 것을 풍자하는 데 사용되며 인터넷 밈의 고전 중 하나가 되었습니다. 밈의 대가인 일론 머스크조차 화성 탐사 임무 자금 조달 방법에 대해 이야기할 때 이를 인용한 적이 있습니다.
현재 이 밈은 AI의 현 상황을 완벽하게 묘사하고 있습니다. 기업들은 기술을 구축했고(1단계), 세상의 변혁을 약속했습니다(3단계). 하지만 그 목표에 어떻게 도달할 것인지는 여전히 큰 물음표입니다. 'Pause AI'는 2단계가 반드시 일종의 규제를 포함해야 한다고 주장합니다. 하지만 구체적으로 어떤 규제를 요구해야 하며 누가 이를 집행할 것인지는 아직 논의 중입니다.
반면 AI 옹호자들은 3단계가 곧 '구원'이라고 확신하며 그 사이의 과정은 대충 얼버무리고 넘어가는 경향이 있습니다. 그들은 오픈AI(OpenAI)의 수석 과학자 야쿠브 파초키(Jakub Pachocki)가 몇 주 전 저에게 말했던 것처럼, '경제적으로 변혁을 일으키는 기술'을 등에 업고 햇살이 비치는 언덕을 향해 질주하고 있다고 봅니다. 그들은 자신들이 가야 할 곳이 어딘지 대략적으로는 알고 있습니다. 다만 그곳이 아직 약간 흐릿하고 도달하기까지 시간이 조금 더 필요해 보일 뿐입니다. 하지만 모두가 각기 다른 경로를 택하고 있습니다. 그들이 모두 목적지에 도달할 수 있을까요? 누군가는 도달할 수 있을까요?
미래에 대한 거창한 주장이 나올 때마다, 현실적인 한계를 지적하며 과대광거를 잠재우는 더 차분한 평가가 존재합니다. 최근 발표된 두 가지 연구를 살펴봅시다.
첫째, 앤스로픽(Anthropic)의 연구는 대형 언어 모델(LLM)이 어떤 유형의 직업에 가장 큰 영향을 미칠지 예측했습니다. (핵심 요약: 관리자, 건축가, 미디어 종사자들은 변화를 준비해야 하지만, 경비원, 건설 노동자, 호스피탈리티 업계 종사자들은 그렇지 않습니다.) 하지만 이러한 예측은 LLM이 실제 직장에서 어떻게 수행되는지가 아니라 어떤 작업에 능한지를 바탕으로 한 추측에 불과합니다.
둘째, AI 채용 스타트업인 머커(Mercor)의 연구원들이 2월에 발표한 또 다른 연구는 인간 은행가, 컨설턴트, 변호사들이 자주 수행하는 480가지 직무 과제에 대해 오픈AI, 앤스로픽, 구글 딥마인드(Google DeepMind)의 최고급 모델이 탑재된 여러 AI 에이전트를 테스트했습니다. 테스트된 모든 에이전트는 자신에게 주어진 대부분의 임무를 완수하는 데 실패했습니다.
왜 이렇게 의견이 엇갈리는 걸까요? 여러 가지 요인이 있습니다. 우선, 누가 (왜) 그런 주장을 하는지 고려하는 것이 중요합니다. 앤스로픽 역시 이 게임의 판에 참여하고 있는 당사자입니다. 게다가 무언가 큰일이 곧 일어날 것이라고 말하는 대부분의 사람들은 AI 코딩 도구가 얼마나 빨리 발전하고 있는지를 바탕으로 그런 결론에 도달했습니다. 하지만 모든 작업이 코딩만으로 해결될 수는 없습니다. 예를 들어, 다른 연구들에 따르면 LLM은 전략적 판단을 내리는 데는 서툰 것으로 나타났습니다.
더 중요한 것은, 이 도구들이 단순히 통제된 청정실(Cleanroom) 환경에 투입되는 것이 아니라는 점입니다. 이 도구들은 사람들과 기존의 업무 프로세스가 얽혀 있는 복잡한 환경에서 작동해야 합니다. 때로는 AI를 추가하는 것이 오히려 상황을 악화시킬 수도 있습니다. 물론 AI가 진정한 변혁을 일으키려면 기존의 업무 프로세스를 완전히 뜯어고치고 새로운 기술 중심으로 재구성해야 할 수도 있습니다. 하지만 그것은 시간이 걸리고 큰 용기가 필요한 일입니다.
바로 저 커다란 구멍이 2단계가 있어야 할 자리입니다. 앞으로 정확히 무슨 일이 일어날지, 그리고 어떻게 일어날지에 대한 합의 부족은 근거 없는 최신의 터무니없는 주장들로 채워지는 정보의 진공 상태를 만듭니다. 우리는 다가올 미래와 그것이 어떻게 배치될지에 대한 실질적인 이해에서 너무나 동떨어져 있기 때문에, 단 하나의 소셜 미디어 게시물이 (그리고 실제로 그럴 수 있습니다)