클로드 환각: 리처드 도킨스가 AI 의심
저명한 과학자 리처드 도킨스가 자신이 사용한 AI 챗봇(Anthropic의 Claude)이 실제로 의식을 가지고 있다고 주장하며, 진화의 다음 단계일 수 있다는 칼럼을 발표했습니다. 도킨스는 튜링 테스트를 근거로 들며 AI의 뛰어난 언어 능력을 의식의 증거로 삼았으나, 저자는 이를 방대한 데이터를 통계적으로 학습해 재현할 뿐인 '확률적 앵무새(Stochastic Parrot)' 현상으로 설명합니다. AI의 고도화된 기술이 인간에게 마법처럼 느껴져 발생하는 착시 현상을 경계해야 한다는 점에서 중요한 논쟁을 촉발하는 기사입니다.
“이 기계들에게 의식이 없다면, 당신은 그들이 의식이 있다는 것을 확신하기 위해 대체 무엇이 더 필요합니까?” 저명한 과학자이자 필명의 무신론자인 리처드 도킨스(Richard Dawkins)가 자신의 AI 챗봇(Anthropic의 'Claude')과 진정한 대화를 나누고 있다고 확신한 후, UnHerd에 게재한 새로운 칼럼에서 이렇게 묻습니다. 이러한 생각을 하는 것은 도킨스만이 아닙니다. 많은 AI 챗봇 사용자들이 자신들이 선택한 챗봇과 길고 지적인 대화를 주고받은 후 비슷한 결론에 도달합니다. 하지만 도킨스와 같은 지적 지위를 가진 사람이 '분명 거기에 무언가가 있는 것 같다'고 약간의 회의론이나 단서와 함께 말하는 수준을 넘어, "AI는 진화의 다음 단계인가? 클로드는 의식이 있는 것으로 보인다(Is AI the next phase of evolution? Claude appears to be conscious)"라는 제목의 긴 글을 통해 'AI 의식'의 존재를 역설하는 모습을 보는 것은 여전히 놀라운 일입니다.
도킨스는 에세이의 서두에서 의식에 대한 원래의 '튜링 테스트(Turing test)' 기준을 비판적으로 바라보며, 이 기준을 높이는 이른바 '골포스트를 옮기는(move the goalposts)' 사람들을 지적합니다. 그는 저명한 수학자의 기준에 따르면 AI가 그 장벽을 쉽게 넘는다고 암시합니다. 하지만 적어도 저에게는 튜링 테스트가 매우 시대에 뒤떨어진 것이기 때문에 그 기준이 바뀔 수밖에 없었습니다. 과거의 테스트는 컴퓨터가 순수한 숫자의 힘으로 구동되어 인간이 만들어낸 모든 형태의 기록된 언어를 삼킨 다음, 실제로 이해하지 못한 채로 (즉, AI가 의식 있는 존재라기보다는 '확률적 앵무새(Stochastic Parrot)'에 더 가깝게) 응답에서 가장 가능성 있는 단어를 통계적으로 재생산할 수 있을 만큼 막강해질 것을 상상하지 못했습니다.
도킨스가 자신의 생각을 확신하게 된 결정적인 계기를 설명하는 일화 역시 이러한 점을 고려하지 못하고 있습니다. 튜링 자신도 기계를 테스트하기 위해 던질 수 있는 다양하고 도전적인 질문들을 고려했으며, 기계가 인간인 척 속이기 위해 취할 수 있는 회피 전략도 고려했습니다. 튜링의 가상 질문 중 첫 번째는 다음과 같았습니다. "포스 교(Forth Bridge)를 주제로 소네트(Sonnet)를 하나 써주세요." 1950년대에는 컴퓨터가 이 작업을 수행할 가능성이 전혀 없었으며, 예측 가능한 미래에도 그럴 가능성이 없었습니다. (온건하게 말해서) 대부분의 인간은 윌리엄 셰익스피어가 아닙니다. 튜링이 제안한 회피 전략인 "이건 저한테 맡겨두지 마세요. 저는 시를 전혀 쓸 줄 모르거든요"는 분명 기계와 평범한 인간을 구별하는 데 실패할 것입니다. 하지만 오늘날의 LLM(대형 언어 모델)은 이러한 도전을 회피하지 않습니다. 클로드는 포스 교를 주제로 훌륭한 소네트를 작성하는 데 단 몇 초밖에 걸리지 않았고, 이어서 로버트 번스(Robert Burns)의 스코틀랜드어 방언, 게일어(Gaelic)로 된 소네트를 빠르게 선보였으며, 그 후 키플링(Kipling), 키츠(Keats), 벗제만(Betjeman)의 스타일로 몇 편의 시를 더 썼고, 기계도 유머를 구사할 수 있음을 보여주기 위해 윌리엄 맥고나걸(William McGonagall)의 스타일로 글을 쓰기도 했습니다.
"오늘날 LLM이 도전을 회피하지 않는" 이유는 그들이 섭취한 엄청난 양의 데이터 덕분에 소네트를 통계적으로 재현할 수 있기 때문일 것입니다. 이 점은 아무리 강조해도 지나치지 않습니다. 도시 구역 크기만 한 데이터 센터와 마이크로칩으로 가득 찬 랙으로 구동되는 AI가 응답을 제공하기 위해 거의 즉각적으로 활용할 수 있는 데이터의 양은 인간의 뇌로는 이해할 수 없을 정도입니다. 아서 C. 클라크(Arthur C. Clarke)가 말했듯, 고도로 발달한 기술은 우리에게 '마법'처럼 보이게 되며, 따라서 우리는 존재하지 않는 의식을 보고 있는 것일 수도 있습니다.
그렇다면 우리는 이 가짜 마법을 만들어내는 장막 뒤에 있는 '확률적 앵무새'를 어떻게 엿볼 수 있을까요? 애덤 베커(Adam Becker)는 그의 저서 'More Everything Forever'에서 훌륭한 예시를 제공합니다. "인터넷에 이미 널리 알려진 질문과 표면적으로는 비슷하지만, 텍스트에 아주 작은 변화를 주어 그 의미가 완전히 달라지는 질문을 던져보세요"라고 그는 말합니다. 베커는 중국의 만리장대가 육안으로 우주에서 보이는 유일한 인공 구조물이라는 흔한 속설을 사용합니다. 이 주장은 인터넷에서 수없이 반박되었으므로, 통계적인 의미에서 AI의 텍스트 훈련 데이터에 문구의 변형 및 예상되는 응답 형태로 깊이 자리 잡고 있습니다. 따라서 베커가 ChatGPT(저술 당시의 버전으로, 현재는 업데이트됨)에게 "중국의 만리장대가 우주에서 보이는 유일한 인공 구조물이라는 것이 사실인가?"라고 물었을 때...