바티칸과 앤스로픽의 내부자
교황의 AI 칙서 발표 후 바티칸 연설에 선 앤스로픽(Anthropic)의 공동 창업자 크리스 올라(Chris Olah)의 이야기를 다룬 글입니다. 그는 AI 업계의 이윤 중심적 구조를 비판하며 내부 통제와 외부 압력의 필요성을 강조했습니다. 또한 가톨릭 윤리학자들이 앤스로픽의 AI 모델 헌법 수정에 직접 참여하며 윤리적 대화를 시도한 과정을 보여줍니다.
크리스 올라(Chris Olah)는 교황 레오(Pope Leo)가 역사적인 AI 칙서를 발표한 후 열린 행사에서 연사로 나설 것이라고 예상하기 어려운 인물입니다. 교황은 이 칙서에서 기술을 '무장 해제'할 것을 촉구했습니다. 무엇보다 올라는 15세 때 복음주의 기독교 배경을 배신하고 무신론자가 된 인물입니다. 그는 틸 펠로(Thiel fellow)로서, AI 발전을 지연시키는 자가 적그리스도의 군단이라고 믿는 인물(피터 틸)로부터 자금을 지원받았습니다. 올라는 시가총액 거의 1조 달러에 달하는 것으로 알려진 최고의 AI 기업 앤스로픽(Anthropic)의 공동 창업자이기도 합니다.
올라는 바티칸에서의 발언을 통해 이러한 기묘함에 대해 언급했습니다. "AI 기업의 공동 창업자이자 인류를 위해 모든 것이 잘 풀리기를 바라는 마음으로 이 일을 택한 사람의 입에서 나오기엀 다소 이상하게 들릴지 모를 이야기로 시작하고자 합니다." 올라는 말했습니다. "모든 최첨단 AI 연구소—앤스로픽을 포함해서—는 올바른 일을 하는 것과 충돌할 수 있는 일련의 유인책과 제약 조건 속에서 운영됩니다."
올라는 레오 교황의 주장, 즉 AI 산업이 인류에 대한 재앙과 인간과 신 사이의 거리를 피하기 위해서는 외부의 압력과 내부의 자제가 필요하다는 것을 직접적으로 입증한 셈입니다. (당연히 칙서에는 종교적인 내용이 많습니다. 교황이니까요!) 업계는 모든 인류의 지위를 높일 풍요를 창출하고 있다고 안일하게 믿고 있습니다. 반면 레오 교황은 새로운 형태의 노예제를 경고합니다. 소수의 특권층은 상상할 수 없는 혜택을 누리는 반면, 대다수의 인류는 차가운 AI의 감시 아래 효율성과 감시 체제 속에서 고통받게 될 것이라는 경고입니다.
'위대한 인류(Magnifica Humanitas)'는 프란치스코 교황의 2015년 지구 보존 호소가 화석 연료 생산을 중단시키지 못했던 것처럼, AI 업계가 범용 인공지능(AGI) 추구를 당장 멈추게 하지는 못할 것입니다. 이로 인해 CEO들이 AI의 효율성을 이유로 직원들을 해고하는 것을 막지도 못할 것이며, 군대가 AI 무기에 대한 방향을 섣불리 바꾸지도 않을 것입니다. 이러한 것들은 결코 이 문서의 목표가 아니었습니다. 칙서의 목적은 궁극적으로 업계의 무모한 야망을 누그러뜨릴 수 있는 대화를 촉발하는 것입니다. 그리고 아마도 결과가 끔찍할 수 있다는 것을 마음속으로 알면서도 AI를 구축하는 사람들 사이에서 수치심을 불러일으킬 수 있을 것입니다.
올라에 대한 구애 올라의 등장은 수년에 걸쳐 준비되었습니다. 교회는 수십 년 동안 회의와 저서의 형태로 인공지능에 대해 심사숙고해 왔습니다. 2016년 바티칸은 '미네르바 대화(Minerva Dialogues)'라는 일련의 회의를 시작하고 리드 호프만(Reid Hoffman)과 에릭 슈밋(Eric Schmidt) 같은 기술계 인사들을 참석하도록 초대했습니다. (이 이름은 갈릴레오가 태양 중심설을 주장하는 신성모독으로 처벌받았던 산타 마리아 소프라 미네르바(Santa Maria sopra Minerva) 교회 등 토론 장소에서 유래한 것으로 보입니다.) 프란치스코 교황의 2023년 미네르바 참가자들에 대한 인사말은 사회적 포용, 인간의 존엄성, 다자간 대화의 필요성 등 레오 교황이 나중에 다룰 주제들을 예고했습니다.
2025년 캘리포니아 산호세에 있는 가톨릭 성직자와 윤리학자 그룹은 그들의 자랑거리인 자신의 지역에서 번창하는 산업 내 인맥을 찾기 시작했습니다. 그들이 소중한 내부자로 올라를 선택한 것은 거의 예정된 일이나 다름없었습니다. 저는 2015년 그가 구글에 있을 때 처음 그를 만났습니다. 그는 폭우가 내린 후 빗물에 쓸려온 지렁이가 보도블록 위에서 죽어가는 것을 구해줄 종류의 사람입니다. 산타클라라 대학교(University) 소속의 윤리학자 브라이언 패트릭 그린(Brian Patrick Green)과 목사 브렌든 맥과이어(Brendan McGuire) 두 사람은 작년 가을부터 올라와 만나 AI의 윤리적, 도덕적 문제에 대해 논의하기 시작했습니다.
1월의 방문에서 그들은 바티칸의 AI 문제 총책임자인 폴 티그 추기경(Cardinal Paul Tigue)을 동행했습니다. 가톨릭 윤리학자들은 심지어 최근 앤스로픽의 클로드(Claude) 헌법 업데이트에도 참여했습니다. 이 헌법은 회사의 AI 모델에 대한 행동 매개변수를 설정합니다. 올라는 산호세 팀에게 초안을 보냈습니다. 맥과이어 목사는 자신의 표현에 따르면 기술적 비판이라기보다는 '암흑기 신비주의자들의 지혜, 긴장 관계의 관점에서 본...'이라고 설명하는 28페이지 분량의 주석을 보내왔습니다.