클로드 미토스 프리뷰 사이버보안 역량 평가
앤스로픽은 새로운 범용 언어 모델인 '클로드 미토스 프리뷰(Claude Mythos Preview)'가 제로데이 취약점 탐지 및 악용에 있어 혁신적인 수준의 사이버보안 역량을 갖췄다고 평가했습니다. 이 모델은 전문 지식이 없는 사용자의 지시만으로도 주요 운영체제와 웹 브라우저의 복잡한 취약점을 자율적으로 찾아내고 공격 코드를 작성할 수 있어, 보안 위협의 패러다임을 바꾸는 중대한 전환점으로 평가받습니다. 이에 앤스로픽은 전 세계 주요 소프트웨어를 보호하기 위한 '프로젝트 글래스윙(Project Glasswing)'을 출범시키고 업계 전반의 선제적 방어 조치를 촉구했습니다.
출처: red.anthropic.com 클로드 미토스 프리뷰의 사이버보안 역량 평가 2026년 4월 7일
Nicholas Carlini, Newton Cheng, Keane Lucas, Michael Moore, Milad Nasr, Vinay Prabhashankar, Winnie Xiao Evyatar Ben Asher, Hakeem Angulu, Jackie Bow, Keir Bradwell, Ben Buchanan, Daniel Freeman, Alex Gaynor, Xinyang Ge, Logan Graham, Hasnain Lakhani, Matt McNiece, Adnan Pirzada, Sophia Porter, Andreas Terzis, Kevin Troy
오늘 저희는 새로운 범용 언어 모델인 '클로드 미토스 프리뷰(Claude Mythos Preview)'를 발표했습니다. 이 모델은 전반적으로 뛰어난 성능을 보여주지만, 특히 컴퓨터 보안 작업에서 눈에 띄는 능력을 발휘합니다. 이에 발맞춰 저희는 미토스 프리뷰를 활용해 전 세계에서 가장 중요한 소프트웨어를 보호하고, 사이버 공격자보다 한발 앞서기 위해 우리 모두가 채택해야 할 실무 방안을 업계에 준비시키기 위한 노력인 '프로젝트 글래스윙(Project Glasswing)'을 시작했습니다.
이 블로그 게시물은 저희가 이 모델을 어떻게 테스트했고 지난 한 달 동안 무엇을 발견했는지 정확히 이해하고자 하는 연구원 및 실무자들에게 기술적인 세부 사항을 제공합니다. 저희는 이 글이 왜 우리가 이번을 보안의 중대한 분수령으로 보는지, 그리고 왜 전 세계 사이버 방어력을 강화하기 위한 공동의 노력을 시작하기로 결정했는지 보여주기를 바랍니다.
저희는 미토스 프리뷰의 전반적인 역량에 대한 인상과 이 모델 및 향후 유사한 모델들이 보안 산업에 어떤 영향을 미칠지에 대한 기대를 먼저 설명합니다. 그런 다음 이 모델을 어떻게 상세하게 평가했고 테스트 중 어떤 결과를 얻었는지 논의합니다. 다음으로 실제 오픈소스 코드베이스에서 제로데이(즉, 아직 발견되지 않은) 취약점을 찾고 악용하는 미토스 프리뷰의 능력을 살펴봅니다. 이후 미토스 프리뷰가 클로즈드 소스 소프트웨어에 대한 익스플로잇을 리버스 엔지니어링하고, N-데이(즉, 알려져 있지만 아직 널리 패치되지 않은) 취약점을 익스플로잇으로 변환할 수 있음이 어떻게 입증되었는지 논의합니다.
아래에서 논의하듯, 저희가 여기서 보고할 수 있는 내용에는 제한이 있습니다. 저희가 발견한 취약점의 99% 이상이 아직 패치되지 않았기 때문에 (저희의 공동 취약점 공개 프로세스에 따라) 그에 대한 세부 정보를 공개하는 것은 무책임한 일입니다. 그러나 저희가 논의할 수 있는 단 1%의 버그만으로도 차세대 모델의 사이버보안 역량에서 상당한 도약을 이루었음을 명확히 보여주며, 이는 업계 전반에 걸친 실질적이고 공동의 방어 조치가 필요함을 시사합니다. 게시물은 오늘날 사이버 방어자들을 위한 조언과 이에 대응하기 위한 긴급한 행동을 업계에 촉구하는 내용으로 마무리됩니다.
클로드 미토스 프리뷰가 사이버보안에 미치는 의미 테스트 과정에서 저희는 미토스 프리뷰가 사용자의 지시를 받으면 모든 주요 운영체제와 모든 주요 웹 브라우저에서 제로데이 취약점을 식별하고 이를 악용할 수 있다는 것을 발견했습니다. 이 모델이 찾아내는 취약점은 종종 미묘하거나 탐지하기 어려운 것들입니다. 그중 다수는 10년 또는 20년 된 것들이며, 지금까지 발견한 것 중 가장 오래된 것은 주로 보안으로 유명한 운영체제인 OpenBSD에서 이미 패치된 27년 된 버그였습니다.
이 모델이 구성하는 익스플로잇은 단순히 일반적인 스택 스매싱(stack-smashing) 공격에 그치지 않습니다 (비록 그러한 것들도 가능하지만). 한 사례에서 미토스 프리뷰는 4개의 취약점을 연결하는(chaining) 웹 브라우저 익스플로잇을 작성했으며, 렌더러와 운영체제 샌드박스 모두를 탈출하는 복잡한 JIT 힙 스프레이(heap spray)를 구현했습니다. 또한 미묘한 레이스 컨디션(race condition)과 KASLR 바이패스를 악용하여 Linux 및 기타 운영체제에서 자율적으로 로컬 권한 상승 익스플로잇을 획득했습니다. 뿐만 아니라 여러 패킷에 걸쳐 20개의 가젯(gadget)으로 구성된 ROP 체인을 분할하여, 인증되지 않은 사용자에게 전체 루트(root) 권한을 부여하는 FreeBSD NFS 서버의 원격 코드 실행 익스플로잇을 자율적으로 작성했습니다.
비전문가 역시 미토스 프리뷰를 활용하여 정교한 취약점을 찾고 악용할 수 있습니다. 공식적인 보안 교육을 받지 않은 앤스로픽의 엔지니어들이 미토스 프리뷰에게 하룻밤 동안 원격 코드 실행 취약점을 찾아달라고 요청한 후, 다음 날 아침 완벽하게 작동하는 익스플로잇을 발견했습니다. 다른 경우에는 연구원들이 스캐폴드(scaffold)를 개발하는 등 다양한 환경에서 모델의 자율성을 테스트했습니다.