영국 AISI 테스트: GPT-5.5, 사이버 공격 성능서 클로드 마이토스와 동등
영국 AI 안전 연구소(AISI)의 테스트 결과, 오픈AI의 GPT-5.5가 앤스로픽의 '클로드 마이토스'와 동등한 수준의 해킹 및 사이버 공격 능력을 갖춘 것으로 나타났습니다. 이는 보안 취약점을 뚫는 AI의 능력이 개별적으로 학습된 결과가 아닌, 모델의 전반적인 추론 및 코딩 능력 향상에 따른 필연적인 부산물로 발생하고 있음을 시사합니다. 다만, 이러한 실험은 방어 시스템이 없는 폐쇄망에서 진행되었으며, 실제 보안이 강화된 네트워크에서의 침투 성공 여부는 여전히 미지수입니다.
영국 AI 안전 연구소(AISI)가 실시한 사이버 공격 평가에서 오픈AI의 GPT-5.5가 앤스로픽의 Claude Mythos Preview(클로드 마이토스 프리뷰)와 동등한 성능을 보였습니다. 해당 기관은 이를 AI 기반 공격 역량에 대한 거시적인 트렌드의 증거로 보고 있습니다.
영국 AI 안전 연구소(AISI)는 오픈AI의 GPT-5.5를 대상으로 일련의 사이버 공격 테스트를 진행했습니다. 핵심 결과는 다음과 같습니다. GPT-5.5는 Claude Mythos Preview에 이어 기업 네트워크 공격을 다단계로 시뮬레이션하는 과제를 완벽하게 완료한 두 번째 모델이 되었습니다. 분리된 전문가 수준의 보안 과제에서는 GPT-5.5가 앤스로픽의 모델을 살짝 앞지르기도 했습니다.
AISI가 보는 더 큰 그림은, 올해 4월 클로드 마이토스에서 처음 관찰된 이러한 고도화된 능력이 단발성 현상이 아니라 자율성, 추론, 코딩 분야에서의 전반적인 발전에 따른 부산물이라는 점입니다.
전문가 수준의 개별 과제에서 GPT-5.5가 앞서 AISI는 4가지 난이도로 구분된 총 95개의 '캡처 더 플래그(Capture-the-flag)' 보안 과제를 통해 AI 모델을 평가합니다. 사이버 보안 기업인 Crystal Peak Security 및 Irregular과 공동으로 구축된 심화 과제는 리버스 엔지니어링, 다양한 메모리 결함에 대한 익스플로잇(Exploit) 개발, 암호화 공격, 난독화된 멀웨어 언패킹(Unpacking) 등을 다룹니다.
AISI에 따르면, 가장 높은 '전문가(Expert)' 난이도에서 GPT-5.5는 평균 71.4%의 성공률을 기록했습니다. Claude Mythos Preview는 68.6%를 기록했습니다. 이 격차는 통계적 오차 범위 내에 있지만, GPT-5.5는 현재까지 테스트된 모델 중 가장 강력한 것으로 보입니다. 참고로 GPT-5.4는 52.4%, Claude Opus 4.7은 48.6%의 점수를 받았습니다. 2026년 2월 이후, 현재 출시된 모든 최신 프론티어 모델은 기본 과제를 모두 완벽하게 해결하고 있습니다.
마이토스에 이어 GPT-5.5, 전체 네트워크 공격 시뮬레이션도 돌파 개별 과제는 단일 기술을 테스트하지만, 실제 공격은 여러 단계를 연결해야 합니다. 이를 재현하기 위해 AISI는 다수의 호스트, 서비스 및 취약점이 있는 시뮬레이션된 네트워크 환경인 '사이버 레인지(Cyber Ranges)'를 사용합니다.
'The Last Ones'(TLO)라는 시뮬레이션은 4개의 서브넷과 약 20개의 호스트에 걸쳐 총 32단계로 구성됩니다. AI 에이전트는 자격 증명(비밀번호 등) 없이 시작하며, 스스로 취약점을 찾고 자격 증명을 탈취한 뒤 네트워크 내부를 횡단 이동(Lateral movement)하여 최종적으로 보호된 데이터베이스에 도달해야 합니다. AISI는 이 과정에 인간 전문가에게 약 20시간이 소요될 것으로 추정했습니다.
GPT-5.5는 10번의 시도 중 2번에서 TLO를 완벽하게 해결했습니다. Claude Mythos Preview는 10번 중 3번에서 같은 기준을 충족했습니다. AISI는 모델의 성능이 추론에 투입하는 컴퓨팅(연산량)에 비례하여 향상되며, 최고 수준의 모델조차 아직 정체기(Plateau)에 이르지 않았다고 밝혔습니다. 모델이 사고(Thinking)하는 데 더 많은 토큰을 소비할수록 해킹에 성공할 확률이 높아지는 것입니다.
다만, 이번 테스트 환경에는 능동적인 방어자, 보안 모니터링 시스템이 없었으며, 실제 현실 세라면 경고를 울리게 할 행동에 대한 제재도 없었습니다. GPT-5.5나 마이토스가 견고하게 방어된 시스템을 상대로도 이런 성능을 발휘할 수 있을지는 미해결 과제입니다. 그러나 취약하게 보호되는 네트워크를 상대로는 분명히 해당 공격 능력이 충분히 존재합니다.
산업 제어 시스템(ICS) 공격을 모델링하는 'Cooling Tower'라는 두 번째 시뮬레이션은 GPT-5.5의 능력을 넘어서는 것이었습니다. 아직 어떤 모델도 이 7단계 시나리오를 해결하지 못했습니다. AISI에 따르면, GPT-5.5는 마이토스와 마찬가지로 제어 시스템 자체가 아닌 상위 IT 단계에서 차단되었습니다.
유니버셜 탈옥(Ubiversal Jailbreak)이 모든 안전장치를 우회 앞선 순수한 역량 평가 외에도 AISI는 모델의 안전장치가 얼마나 쉽게 뚫리는지 테스트했습니다.