클라우드플레어: 앤스로픽 신모델이 기존 AI가 놓친 취약점 발견
클라우드플레어는 보안 특화 AI 모델인 앤스로픽의 'Mythos Preview'를 자체 코드에 테스트한 결과, 기존 최고 수준 모델들이 찾지 못한 취약점을 스스로 연결해 실제 익스플로잇을 구성할 수 있음을 확인했습니다. 이 모델은 PoC 코드를 직접 작성, 컴파일, 실행하며 위협의 실재성을 입증하고 인간의 개입을 최소화했습니다. 해당 기술은 방어뿐만 아니라 공격자들에게도 악용될 수 있다는 점에서 보안 패러다임의 중요한 전환점을 시사합니다.
클라우드플레어(Cloudflare)에 따르면, 앤스로픽(Anthropic)의 보안 특화 AI 모델인 'Mythos Preview'는 이전 최고 수준의 프론티어 모델(Frontier models)들이 찾지 못한 익스플로잇 체인(Exploit chains)을 찾아냈습니다. 막시밀리안 슈라이너(Maximilian Schreiner)가 작성한 이 기사는 2026년 5월 19일에 게재되었습니다.
클라우드플레어는 '프로젝트 글래스윙(Project Glasswing)'의 일환으로 50개 이상의 자체 코드 저장소에서 앤스로픽의 보안 특화 AI 모델 'Mythos Preview'를 테스트했습니다. 이 모델은 여러 개의 작은 취약점을 연결하여 실제로 작동하는 익스플로잇으로 구성할 수 있으며, 개념 증명(PoC, Proof-of-Concept) 코드를 직접 작성, 컴파일 및 실행하여 그 위협이 실제 존재함을 증명합니다.
클라우드플레어의 그랜트 부르지카스(Grant Bourzikas) 최고 보안 책임자(CSO)에 따르면, 이전 세대의 프론티어 모델들도 개별적인 버그는 잘 찾아냈고 때로는 훌륭한 분석 결과를 제공했습니다. 하지만 이 모델들은 여러 취약점을 하나로 연결하는 데는 한계가 있었고, 익스플로잇 체인을 끝까지 완성하지 못해 실제 악용 가능성 여부를 명확히 판단할 수 없었습니다.
반면, Mythos Preview는 추측에 기반한 결과를 훨씬 적게 도출했고, 문제를 재현하기 위한 단계를 더 명확하게 제시했습니다. 또한 수정 또는 기각(수동 조치 불필요)의 결정을 내리기까지 인간의 추가적인 개입이 덜 필요했습니다.
클라우드플레어는 단일 에이전트(Agent)만으로는 충분하지 않다고 강조했습니다. 회사는 최대 50개의 병렬 에이전트를 구성하고 적대적 검토(Adversarial review)를 포함하는 다단계 테스트 하네스(Harness)를 구축했으며, 여기서는 두 번째 에이전트가 각각의 발견을 반박하려고 시도합니다.
마지막으로 회사는 경고합니다. 이러한 강력한 기능은 방어자뿐만 아니라 공격자들에게도 동일하게 제공될 것이라는 점입니다.