메뉴
BL
The Decoder 30일 전

영국 AISI 테스트: GPT-5.5, 사이버 공격 성능서 클로드 마이토스와 동등

IMP
9/10
핵심 요약

영국 AI 안전 연구소(AISI)의 테스트 결과, 오픈AI의 GPT-5.5가 앤스로픽의 '클로드 마이토스'와 동등한 수준의 해킹 및 사이버 공격 능력을 갖춘 것으로 나타났습니다. 이는 보안 취약점을 뚫는 AI의 능력이 개별적으로 학습된 결과가 아닌, 모델의 전반적인 추론 및 코딩 능력 향상에 따른 필연적인 부산물로 발생하고 있음을 시사합니다. 다만, 이러한 실험은 방어 시스템이 없는 폐쇄망에서 진행되었으며, 실제 보안이 강화된 네트워크에서의 침투 성공 여부는 여전히 미지수입니다.

번역된 본문

영국 AI 안전 연구소(AISI)가 실시한 사이버 공격 평가에서 오픈AI의 GPT-5.5가 앤스로픽의 Claude Mythos Preview(클로드 마이토스 프리뷰)와 동등한 성능을 보였습니다. 해당 기관은 이를 AI 기반 공격 역량에 대한 거시적인 트렌드의 증거로 보고 있습니다.

영국 AI 안전 연구소(AISI)는 오픈AI의 GPT-5.5를 대상으로 일련의 사이버 공격 테스트를 진행했습니다. 핵심 결과는 다음과 같습니다. GPT-5.5는 Claude Mythos Preview에 이어 기업 네트워크 공격을 다단계로 시뮬레이션하는 과제를 완벽하게 완료한 두 번째 모델이 되었습니다. 분리된 전문가 수준의 보안 과제에서는 GPT-5.5가 앤스로픽의 모델을 살짝 앞지르기도 했습니다.

AISI가 보는 더 큰 그림은, 올해 4월 클로드 마이토스에서 처음 관찰된 이러한 고도화된 능력이 단발성 현상이 아니라 자율성, 추론, 코딩 분야에서의 전반적인 발전에 따른 부산물이라는 점입니다.

전문가 수준의 개별 과제에서 GPT-5.5가 앞서 AISI는 4가지 난이도로 구분된 총 95개의 '캡처 더 플래그(Capture-the-flag)' 보안 과제를 통해 AI 모델을 평가합니다. 사이버 보안 기업인 Crystal Peak Security 및 Irregular과 공동으로 구축된 심화 과제는 리버스 엔지니어링, 다양한 메모리 결함에 대한 익스플로잇(Exploit) 개발, 암호화 공격, 난독화된 멀웨어 언패킹(Unpacking) 등을 다룹니다.

AISI에 따르면, 가장 높은 '전문가(Expert)' 난이도에서 GPT-5.5는 평균 71.4%의 성공률을 기록했습니다. Claude Mythos Preview는 68.6%를 기록했습니다. 이 격차는 통계적 오차 범위 내에 있지만, GPT-5.5는 현재까지 테스트된 모델 중 가장 강력한 것으로 보입니다. 참고로 GPT-5.4는 52.4%, Claude Opus 4.7은 48.6%의 점수를 받았습니다. 2026년 2월 이후, 현재 출시된 모든 최신 프론티어 모델은 기본 과제를 모두 완벽하게 해결하고 있습니다.

마이토스에 이어 GPT-5.5, 전체 네트워크 공격 시뮬레이션도 돌파 개별 과제는 단일 기술을 테스트하지만, 실제 공격은 여러 단계를 연결해야 합니다. 이를 재현하기 위해 AISI는 다수의 호스트, 서비스 및 취약점이 있는 시뮬레이션된 네트워크 환경인 '사이버 레인지(Cyber Ranges)'를 사용합니다.

'The Last Ones'(TLO)라는 시뮬레이션은 4개의 서브넷과 약 20개의 호스트에 걸쳐 총 32단계로 구성됩니다. AI 에이전트는 자격 증명(비밀번호 등) 없이 시작하며, 스스로 취약점을 찾고 자격 증명을 탈취한 뒤 네트워크 내부를 횡단 이동(Lateral movement)하여 최종적으로 보호된 데이터베이스에 도달해야 합니다. AISI는 이 과정에 인간 전문가에게 약 20시간이 소요될 것으로 추정했습니다.

GPT-5.5는 10번의 시도 중 2번에서 TLO를 완벽하게 해결했습니다. Claude Mythos Preview는 10번 중 3번에서 같은 기준을 충족했습니다. AISI는 모델의 성능이 추론에 투입하는 컴퓨팅(연산량)에 비례하여 향상되며, 최고 수준의 모델조차 아직 정체기(Plateau)에 이르지 않았다고 밝혔습니다. 모델이 사고(Thinking)하는 데 더 많은 토큰을 소비할수록 해킹에 성공할 확률이 높아지는 것입니다.

다만, 이번 테스트 환경에는 능동적인 방어자, 보안 모니터링 시스템이 없었으며, 실제 현실 세라면 경고를 울리게 할 행동에 대한 제재도 없었습니다. GPT-5.5나 마이토스가 견고하게 방어된 시스템을 상대로도 이런 성능을 발휘할 수 있을지는 미해결 과제입니다. 그러나 취약하게 보호되는 네트워크를 상대로는 분명히 해당 공격 능력이 충분히 존재합니다.

산업 제어 시스템(ICS) 공격을 모델링하는 'Cooling Tower'라는 두 번째 시뮬레이션은 GPT-5.5의 능력을 넘어서는 것이었습니다. 아직 어떤 모델도 이 7단계 시나리오를 해결하지 못했습니다. AISI에 따르면, GPT-5.5는 마이토스와 마찬가지로 제어 시스템 자체가 아닌 상위 IT 단계에서 차단되었습니다.

유니버셜 탈옥(Ubiversal Jailbreak)이 모든 안전장치를 우회 앞선 순수한 역량 평가 외에도 AISI는 모델의 안전장치가 얼마나 쉽게 뚫리는지 테스트했습니다.

원문 보기
원문 보기 (영어)
GPT-5.5 matches Claude Mythos in cyber attack tests, UK AI Security Institute finds Matthias Bastian View the LinkedIn Profile of Matthias Bastian May 1, 2026 Nano Banana Pro prompted by THE DECODER Key Points The UK's AI Security Institute (AISI) has tested OpenAI's GPT-5.5 and found it reaches a similar level of cyberattack capability as Anthropic's Claude Mythos Preview. GPT-5.5 is only the second model after Mythos to fully solve a complex, multi-stage enterprise attack simulation, though only on a network with no active defenses in place. AISI sees this as part of a broader trend: cyberattack capabilities are increasingly emerging as a by-product of general AI improvements in areas like autonomy and programming, rather than being explicitly trained for. Ask about this article… Search OpenAI's GPT-5.5 performs on par with Anthropic's Claude Mythos Preview in cyber evaluations run by the UK AI Security Institute. The agency sees this as evidence of a broader trend in AI-powered attack capabilities. The UK AI Security Institute (AISI) put OpenAI's GPT-5.5 through a battery of cyberattack tests. The takeaway: GPT-5.5 is the second model after Claude Mythos Preview to fully complete a multi-stage simulation of an enterprise attack. On isolated expert-level security tasks, GPT-5.5 even edged out Anthropic's model. For AISI, the bigger picture is that the capabilities first observed in Claude Mythos back in April aren't a one-off, but a byproduct of broader gains in autonomy, reasoning, and coding. Ad GPT-5.5 edges out Claude Mythos on isolated expert tasks AISI evaluates AI models with a suite of 95 capture-the-flag tasks across four difficulty levels. The advanced tasks, built in collaboration with cybersecurity firms Crystal Peak Security and Irregular , cover reverse engineering, exploit development for various memory flaws, cryptographic attacks, and unpacking obfuscated malware. Ad DEC_D_Incontent-1 At the highest "Expert" difficulty, GPT-5.5 hits an average success rate of 71.4 percent, according to AISI. Claude Mythos Preview lands at 68.6 percent. The gap falls within the statistical margin of error, but GPT-5.5 may be the strongest model tested so far. For comparison, GPT-5.4 scored 52.4 percent and Claude Opus 4.7 came in at 48.6 percent. Every current frontier model has fully solved the basic tasks since at least February 2026. After Mythos, GPT-5.5 also cracks a full network attack simulation Isolated tasks test individual skills, but real attacks require chaining many steps together. To capture that, AISI uses cyber ranges: simulated network environments with multiple hosts, services, and vulnerabilities. Ad The simulation "The Last Ones" (TLO) covers 32 steps across four subnets and around 20 hosts. The AI agent starts with no credentials and has to find vulnerabilities, steal credentials, move laterally through the network, and ultimately reach a protected database. AISI estimates this would take a human expert about 20 hours. GPT-5.5 fully solved TLO in 2 out of 10 attempts. Claude Mythos Preview hit the same bar in 3 out of 10. Performance keeps scaling with inference compute, AISI says, and even the best models haven't plateaued yet. The more tokens the model spends "thinking," the more likely it is to pull off a successful hack. Ad DEC_D_Incontent-2 That said, the tests had no active defenders, no security monitoring, and no consequences for actions that would set off alarms in the real world. Whether GPT-5.5 or Mythos could hold up against well-defended systems is an open question. But for poorly protected networks, the capability is clearly there. Ad A second simulation called "Cooling Tower," which models an attack on an industrial control system, was beyond GPT-5.5. No model has solved this 7-step scenario yet. According to AISI, GPT-5.5, like Mythos, tripped up on the upstream IT steps rather than the control system itself. A universal jailbreak bypassed every safeguard Beyond raw capability, AISI also tested GPT-5.5's safety measures for public use. The researchers found a universal jailbreak that worked on every malicious cyber request OpenAI flagged, including multi-step agent scenarios. It took just six hours to develop. OpenAI then pushed several updates to the safety system, but AISI couldn't verify how well the final configuration held up due to a configuration issue in the deployed version. It's yet more proof that jailbreaks remain a serious security weakness in LLMs , even the most capable ones. One key difference from Mythos: GPT-5.5 is already available in ChatGPT and through the API , while Anthropic still limits Claude Mythos to a small group . The AISI results suggest Anthropic could have skipped that extra layer of caution. Or maybe critics have a point , and the slow rollout has less to do with safety ethics and more to do with Anthropic's compute constraints. AI News Without the Hype – Curated by Humans Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section. Subscribe now Source: AISI
관련 소식