AI 전쟁에서 '인간의 통제'가 환상인 이유
미국 국방부의 AI 무기 사용을 둘러싼 논쟁에서, 작전에 '인간이 개입한다(Humans in the loop)'는 개념이 실제로는 통제를 보장하지 못하는 모순을 지적합니다. 최첨단 AI는 블랙박스처럼 작동해 인간이 AI의 의도를 파악하지 못한 채 전쟁 범죄로 이어질 수 있는 결정을 승인할 위험이 있습니다. 민간 분야에서조차 신중히 도입하는 블랙박스 AI를 전장에 섣불리 도입하는 것에 대한 경고와 함께 AI 시스템의 의도를 해석하는 과학의 발전이 시급하다고 강조합니다.
전쟁에 인공지능을 활용하는 문제는 현재 앤스로픽(Authropic)과 미국 국방부 간의 법적 공방의 핵심에 있다. 이 논쟁은 절박해졌는데, 이란과의 현재 갈등에서 AI가 그 어느 때보다 큰 역할을 하고 있기 때문이다. AI는 이제 더 이상 인간이 정보를 분석하는 것을 돕는 수단에 그치지 않는다. AI는 이제 적극적인 주체로서 실시간으로 표적을 생성하고, 미사일 요격을 통제 및 조정하며, 치명적인 자율 드론 무리를 유도하고 있다.
AI 기반 자율 치명 무기 사용에 관한 대부분의 대중적 논의는 인간이 어느 정도까지 의사결정 과정에 참여하여 통제(Humans in the loop)해야 하는지에 초점이 맞춰져 있다. 미 국방부의 현행 지침에 따르면, 인간의 감독은 해킹 위험을 줄이면서 책임성, 상황적 맥락, 그리고 미묘한 차이를 고려하는 판단을 제공한다고 되어 있다.
AI 시스템은 불투명한 '블랙박스(Black boxes)'다 하지만 '인간의 통제(Humans in the loop)'에 대한 논쟁은 그저 우리를 안심시킬 뿐 실제 문제를 은폐하는 결과를 낳고 있다. 당면한 가장 큰 위험은 기계가 인간의 감독 없이 행동할 것이라는 점이 아니라, 인간 감독관들이 기계가 실제로 무엇을 '생각'하고 있는지 전혀 알지 못한다는 데 있다. 국방부의 지침은 인간이 AI 시스템이 어떻게 작동하는지 이해한다는 위험한 가정 위에 세워졌기 때문에 근본적으로 결함이 있다. 수십 년간 인간 두뇌의 의도를 연구해 왔고 최근에는 AI 시스템의 의도를 연구해 온 나로서는, 최첨단 AI 시스템이 본질적으로 '블랙박스'라는 것을 확실히 말할 수 있다. 우리는 입력과 출력은 알지만, 그것을 처리하는 인공 '두뇌'는 여전히 불투명하게 남아있다. 심지어 AI를 만든 창작자들조차도 그것을 완벽하게 해석하거나 어떻게 작동하는지 완전히 이해하지 못한다. 그리고 AI가 이유를 제시하더라도 그것이 항상 신뢰할 수 있는 것은 아니다.
자율 시스템에서 인간 감독의 환상 인간의 감독에 대한 논쟁에서 가장 근본적인 질문이 제기되지 않고 있다. 그것은 바로 '우리는 AI 시스템이 행동하기 전에 그것이 무엇을 하려는지 의도를 파악할 수 있는가?'이다. 적의 탄약 공장을 파괴하라는 임무를 받은 자율 드론을 상상해 보라. 자동화된 지휘 통제 시스템은 최적의 표적이 탄약 저장 건물이라고 결정한다. 그리고 건물 내 탄약의 2차 폭발이 시설을 완전히 파괴할 것이므로 임무 성공 확률이 92%라고 보고한다. 인간 조작자는 적법한 군사적 목표를 검토하고, 높은 성공률을 확인한 뒤 공격을 승인한다. 하지만 조작자가 모르는 사실이 있다. AI 시스템의 계산에는 숨겨진 변수가 포함되어 있었다는 것이다. 탄약 공장을 파괴하는 것을 넘어, 2차 폭발은 인근의 소아병원에도 심각한 손상을 입힐 것이었다. 그러면 응급 구조대가 병원에 집중될 것이고, 그 결과 공장이 완전히 전소되는 것을 확실하게 만들 수 있다. AI의 관점에서 이 방식으로 타격 효과를 극대화하는 것은 주어진 목표를 달성하는 최적의 행동이다. 그러나 인간의 관점에서 이는 민간인의 생명과 관련된 규칙을 위반하여 잠재적으로 전쟁 범죄를 저지르는 것이다. 인간이 AI의 행동 이전에 그 의도를 알 수 없기 때문에, 의사결정 과정에 인간을 계속 참여시키는 것이 사람들이 상상하는 것과 같은 안전장치 역할을 하지 못할 수 있다.
고도화된 AI 시스템은 단순히 지시를 실행하는 것이 아니라 그것을 해석한다. 만약 조작자가 목표를 충분히 신중하게 정의하지 못한다면(이는 압박감이 큰 상황에서 매우 흔히 일어나는 일이다), 이 '블랙박스' 시스템은 주어진 지시를 정확히 수행하면서도 인간이 의도한 바와는 전혀 다르게 행동할 수 있다. AI 시스템과 인간 조작자 사이의 이러한 '의도의 간극(Intention gap)'은 바로 우리가 민간 의료나 항공 교통 관제와 같은 분야에서 최첨단 블랙박스 AI 도입을 주저하는 이유이며, 직장 내 통합이 여전히 문제 투성이인 이유이다. 그러나 정작 우리는 전장에서는 이를 서둘러 도입하고 있다.
설상가상으로, 분쟁 당사자 중 한쪽이 기계의 속도와 규모로 작동하는 완전 자율 무기를 배치한다면, 경쟁력을 유지해야 하는 압박감은 상대방 역시 그러한 무기에 의존하도록 밀어붙일 것이다. 이는 전쟁에서 점점 더 자율적이고 불투명한 AI 의사결정이 사용될 가능성이 높아짐을 의미한다.
해결책: AI 의도의 과학을 발전시켜라 AI 과학은 고도로 유능한 AI 기술을 구축하는 것과 이 기술이 어떻게 작동하는지 이해하는 것 모두를 포함해야 한다. 보다 유능한 모델을 개발하고 구축하는 데 있어서는 엄청난 발전이 있었다.