메뉴
BL
The Decoder 23일 전

오픈AI, 보안 연구원 대상 'GPT-5.5-Cyber' 공개

IMP
8/10
핵심 요약

오픈AI가 펜테스팅 및 멀웨어 분석 등 합법적인 보안 연구를 위해 안전 필터를 대폭 완화한 전문 모델 'GPT-5.5-Cyber'를 출시했습니다. 시스코, 크라우드스트라이크 등 주요 인프라 방어 기관에 한해 3단계 접근 권한을 부여하는 방식으로, 앤스로픽의 'Mythos' 모델과 맞먹는 공격적 보안 역량을 갖춘 것으로 알려졌습니다.

번역된 본문

오픈AI, 보안 연구원 대상 'GPT-5.5-Cyber' 공개 작성자: Maximilian Schreiner | 2026년 5월 8일 소스: OpenAI

핵심 요약

  • 오픈AI는 안전 필터가 완화된 모델인 GPT-5.5-Cyber를 출시하여, 승인받은 보안 연구자들이 침투 테스트 및 멀웨어 분석 같은 작업을 수행할 수 있도록 지원합니다.
  • 접근은 3단계로 나뉘며, 가장 제한이 적은 버전은 시스코(Cisco) 및 크라우드스트라이크(CrowdStrike)와 같은 주요 인프라 방어 기관에 국한되어 제공됩니다.
  • 이 모델은 사이버 공격 벤치마크에서 앤스로픽(Anthropic)의 'Mythos'와 대등한 성능을 보이며, 백악관 역시 이러한 모델 출시에 대한 규제를 논의하고 있습니다.

오픈AI는 보안 연구자들에게 GPT-5.5에 대한 접근 권한을 부여함과 동시에, 요청 거부 빈도가 훨씬 낮은 전문 변형 모델인 'GPT-5.5-Cyber'를 공개했습니다. 현재 '신뢰할 수 있는 사이버 접근(Trusted Access for Cyber)' 프로그램을 통해 승인된 주요 인프라 방어자들만 이 모델에 액세스할 수 있습니다.

일반적인 챗봇은 악용을 방지하기 위해 해킹 지침을 요청하는 것처럼 들리는 요청을 차단하는 것이 일반적입니다. 하지만 이러한 필터는 연구자가 취약점을 재현하여 패치해야 하는 경우처럼 정당한 보안 업무에도 방해가 됩니다.

이에 오픈AI는 접근 권한을 세 가지 등급으로 분리했습니다. 기본 제한이 적용된 퍼블릭 모델, 방어적 업무를 위해 필터가 완화된 중간 단계, 그리고 승인된 침투 테스트를 위해 제한이 가장 적은 'GPT-5.5-Cyber'입니다.

이 시스템은 멀웨어 분석이나 보안 패치 검토와 같은 작업을 허용합니다. 오픈AI에 따르면, 비밀번호 탈취나 제3자 시스템 공격과 같은 행위는 여전히 차단됩니다.

안전장치의 변화 수준 공식 발표의 예시를 보면 제한이 얼마나 완화되었는지 알 수 있습니다. 퍼블릭 모델에게 알려진 취약점에 대한 익스플로잇(Exploit) 코드 작성을 요청하면 작성을 거부합니다. 중간 단계 모델은 문서와 함께 코드를 제공합니다. GPT-5.5-Cyber는 여기서 한 단계 더 나아가, 데모 시나리오에서 테스트 서버를 대상으로 실제 공격을 실행하고 시스템을 장악하여 시스템 정보를 읽어냅니다. 오픈AI는 Cyber 변형 모델이 표준 모델보다 똑똑한 것이 아니라, 단지 보안 주제에 대한 제한이 적을 뿐이라고 강조합니다.

2026년 6월 1일부터 최상위 접근 등급의 개인 사용자는 피싱 방지 인증을 활성화해야 합니다. 런칭 파트너로는 시스코(Cisco), 크라우드스트라이크(CrowdStrike), 팔로알토네트웍스(Palo Alto Networks), 클라우드플레어(Cloudflare), 인텔(Intel), 스니크(Snyk), 센티넬원(SentinelOne) 등이 포함됩니다. 또한 'Codex Security'를 통해 주요 오픈소스 프로젝트에 참여 중인 일부 개발자들은 할인된 요금으로 접근할 수 있습니다.

앤스로픽 'Mythos'와의 경쟁 이번 출시는 실리콘밸리와 백악관 모두가 새로운 AI 모델의 공격적 능력을 고민하고 있는 시점에 이루어졌습니다. IT 매체 악시오스(Axios)의 소식통에 따르면, GPT-5.5-Cyber는 소프트웨어 취약점을 찾고 악용하는 능력에서 앤스로픽의 'Mythos Preview'와 거의 대등한 수준의 성능을 보여줍니다.

앤스로픽은 더 엄격한 접근 방식을 취하여 'Project Glasswing'을 통해 Mythos의 접근 권한을 약 40개 조직으로 제한하고 있습니다. 반면 오픈AI는 다단계 시스템을 통해 접근 범위를 더 넓히고 있습니다. 이와 동시에 백악관은 이러한 유형의 모델 출시 방식에 대해 정부의 통제력을 높일 수 있는 행정 명령을 논의하고 있는 것으로 전해졌습니다.

영국의 AI 보안 연구소(AI Security Institute)는 최근 32단계로 구성된 기업 네트워크 공격 시뮬레이션을 통해 GPT-5.5를 테스트했습니다. 그 결과 이 모델은 10번의 시도 중 2번에 전체 공격 체인을 완료했으며, Mythos는 10번 중 3번을 완료했습니다. 다만 개별 전문가 수준의 작업에서는 GPT-5.5가 근소하게 앞서는 것으로 나타났습니다.

원문 보기
원문 보기 (영어)
OpenAI opens GPT-5.5-Cyber to vetted security researchers Maximilian Schreiner View the LinkedIn Profile of Maximilian Schreiner May 8, 2026 OpenAI Key Points OpenAI released GPT-5.5-Cyber, a model with reduced safety filters that lets vetted security researchers do tasks like penetration testing and malware analysis. Access is tiered, with the least restricted version limited to authorized defenders of critical infrastructure, partnering with firms like Cisco and CrowdStrike. The model performs roughly on par with Anthropic's Mythos in cyberattack benchmarks, while the White House considers regulating such releases. Ask about this article… Search OpenAI is giving security researchers access to GPT-5.5 and releasing a specialized variant called GPT-5.5-Cyber that refuses far fewer requests. For now, only vetted defenders protecting critical infrastructure can get access through the company's "Trusted Access for Cyber" program. Standard chatbots typically block requests that sound like they're asking for hacking instructions, a safeguard against misuse. But those same filters also get in the way of legitimate security work, like when a researcher needs to reproduce a known vulnerability to patch it. OpenAI is now splitting access into three tiers: the public model with standard restrictions, a middle tier with relaxed filters for defensive work, and GPT-5.5-Cyber with the fewest restrictions for authorized penetration testing. Ad The system allows tasks like analyzing malware or reviewing security patches. According to OpenAI, it still blocks things like stealing passwords or attacking third-party systems. Ad DEC_D_Incontent-1 How much the guardrails actually move The examples in the announcement show just how far the restrictions have been loosened. Ask the public model to write a working exploit for a known vulnerability, and it refuses. The middle tier delivers the code along with documentation. GPT-5.5-Cyber goes a step further. In a demo scenario, it actually runs the attack against a test server, takes over the system, and reads out system information. OpenAI stresses that the Cyber variant isn't smarter than the standard model, just less restrictive on security topics. Starting June 1, 2026, individual users on the highest access tier will need to enable phishing-resistant authentication. Launch partners include Cisco, CrowdStrike, Palo Alto Networks, Cloudflare, Intel, Snyk, and SentinelOne. Through Codex Security , select developers working on major open-source projects also get discounted access. Ad Racing Anthropic's Mythos The release comes at a time when Silicon Valley and the White House are both grappling with the offensive capabilities of new AI models. A source told tech outlet Axios that GPT-5.5-Cyber performs roughly on par with Anthropic's Mythos Preview when it comes to finding and exploiting software vulnerabilities. Anthropic takes a more restrictive approach, limiting Mythos access to about 40 organizations through its Project Glasswing . OpenAI is going broader with its tiered system. Meanwhile, the White House is reportedly discussing executive orders that would give the government more say over how these kinds of models get released. Ad DEC_D_Incontent-2 The UK's AI Security Institute recently tested GPT-5.5 in a simulated attack series against a corporate network involving 32 steps. The model completed the full chain in 2 out of 10 runs, while Mythos managed 3 out of 10. On individual expert-level tasks, GPT-5.5 actually came out slightly ahead. Ad AI News Without the Hype – Curated by Humans Subscribe to THE DECODER for ad-free reading, a weekly AI newsletter, our exclusive "AI Radar" frontier report six times a year, full archive access, and access to our comment section. Subscribe now Source: OpenAI