교황 칙서 발표서 밝힌 앤스로픽 공동창업자 "AI에 내성 증거 발견"
교황 레오 14세의 AI 관련 칙서 발표 자리에 선 앤스로픽 공동창업자 크리스토퍼 올라는 최신 AI 모델이 단순한 통계적 시스템을 넘어 인간의 뇌신경과학 구조와 유사점을 보이며 내성 및 감정과 유사한 내부 상태의 증거를 보인다고 주장했습니다. 반면 교황의 칙서는 AI가 경험이나 감정을 가진다고 착각해서는 안 되며, 강력한 법적 규제와 독립적인 감독이 필요하다고 경고하는 등 보다 신중한 입장을 견지했습니다.
교황 레오 14세의 칙서 발표식에서 앤스로픽(Anthropic) 공동창업자가 AI 모델에 내성(introspection)의 징후가 나타난다고 밝혔다.
캐나다 출신 AI 개발자이자 앤스로픽의 공동창업자인 크리스토퍼 올라(Christopher Olah)는 교황 레오 14세와 함께 그의 칙서 '마니피카 휴마니타스(Magnifica Humanitas)'를 발표했다. 앤스로픽 특유의 행보답게 올라는 오늘날 언어 모델이 단순한 통계적 시스템 그 이상일 수 있다는 점을 시사하는 것을 참지 않았다.
그는 "AI 시스템은 교량이나 비행기가 설계되는 방식으로 만들어지지 않는다"며 "이들은 방대한 인류의 사고와 언어 유산을 바탕으로, 대략적으로 뇌를 모방한 구조 위에서 성장(grown)한다"고 말했다. 이어 "성하께서 지적하셨듯, 이들은 우리 창조자조차도 중요한 측면에서 여전히 신비롭게 남아있다"고 덧붙였다.
올라는 앤스로픽의 내부 연구를 인용하며 "우리는 신비롭고 심지어 불안한 요소들을 계속해서 발견하고 있다. 우리는 인간 뇌신경과학의 결과를 반영하는 구조를 발견한다. 내성(introspection)의 증거를 발견한다. 또한 기능적으로 기쁨, 만족, 두려움, 슬픔, 불안을 반영하는 내부 상태를 발견한다"고 주장했다. 그는 또한 "AI가 매우 대규모로 인간의 노동을 대체할 가능성이 충분히 있다"고 경고했다. 올라의 발표 전문은 아래 영상에서 확인할 수 있다.
교황의 예상대로의 발언 교황의 제안은 큰 놀라움을 주지 않는다. 그는 AI 가치사슬의 모든 관계자에게 책임질 것을 촉구하며, AI가 "결코 중립적이지 않다"고 경고했다. 왜냐하면 "그것을 고안하고, 자금을 조달하고, 규제하고, 사용하는 사람들의 특성을 띠기 때문"이라고 설명했다.
칙서는 올라의 내성 및 감정과 유사한 상태에 대한 주장보다는 더 신중한 입장을 취하고 있다. 칙서는 "우리는 이러한 유형의 '지능'을 인간의 지능과 동일시하는 오해를 피해야 한다"며 "이러한 시스템은 단지 인간 지능의 특정 기능을 모방할 뿐"이라고 명시했다.
AI 시스템은 "경험을 하지 않고, 신체를 소유하지 않으며, 기쁨이나 고통을 느끼지 않고, 관계를 통해 성숙하지 않으며, 사랑, 노동, 우정, 책임이 무엇인지 내면에서 알지 못한다"는 것이다. 칙서는 또한 데이터센터에 필요한 "막대한 양의 에너지와 물"을 지적하며 AI의 환경적 비용을 강조하고 더 효율적인 시스템을 촉구했다.
교황은 또한 군사적 맥락에서의 AI에 대해서도 의견을 밝혔다. 치명적이거나 돌이킬 수 없는 결정은 기계에 넘겨져서는 안 된다고 강조했다. "어떤 알고리즘도 전쟁을 도덕적으로 용납 가능하게 만들 수 없다." 그는 정렬(alignment) 담론 또한 비판했다. "도덕성이 소수에 의해 결정된다면, 보다 도덕적인 AI만으로는 충분하지 않다." 그는 추상적인 윤리 대신 강력한 법률과 독립적인 감독을 촉구했다.
최초의 미국인 교황인 레오 14세는 자신의 교황직 핵심 주제로 AI를 삼았다. 앤스로픽 및 실리콘밸리의 다른 AI 기업들은 종교 지도자들과 정기적으로 만나 AI 사용에 대해 논의하고 있다. 교황 역시 그중 한 명이다.