메뉴
HN
Hacker News 53일 전

프로젝트 글래스윙: AI 시대 핵심 소프트웨어 보안 강화

IMP
9/10
핵심 요약

아마존, 구글, 마이크로소프트, 애플 등 글로벌 빅테크 기업들이 안스로픽(Amthropic)과 연합해 전 세계 핵심 소프트웨어를 보호하기 위한 '프로젝트 글래스윙'을 발표했습니다. 이 이니셔티브는 최고 수준의 해킹 및 취약점 발굴 능력을 갖춘 미공개 AI 모델 '클로드 마이토스(Claude Mythos)'를 방어 목적으로 활용하여 사이버 보안 위협을 선제적으로 차단하는 것이 핵심입니다. 안스로픽은 이 프로젝트를 위해 최대 1억 달러 규모의 AI 사용 크레딧과 오픈소스 보안 기관에 400만 달러를 지원하며, AI 기술의 악용을 막고 방어 기술로 전환하려는 글로벌 산업계의 시급한 대응을 보여줍니다.

번역된 본문

프로젝트 글래스윙: AI 시대의 핵심 소프트웨어 보안 강화

계속 읽기

소개 오늘 우리는 프로젝트 글래스윙(Project Glasswing) 1을 발표합니다. 이는 아마존 웹 서비스(AWS), 안스로픽(Anthropic), 애플(Apple), 브로드컴(Broadcom), 시스코(Cisco), 크라우드스트라이크(CrowdStrike), 구글(Google), JP모건 체이스(JPMorganChase), 리눅스 재단(Linux Foundation), 마이크로소프트(Microsoft), 엔비디아(NVIDIA), 팔로알토 네트웍스(Palo Alto Networks)가 힘을 합쳐 전 세계에서 가장 중요한 소프트웨어를 보호하기 위한 새로운 이니셔티브입니다.

우리가 프로젝트 글래스윙을 결성한 이유는 안스로픽이 학습시킨 새로운 프론티어 모델(Frontier model)에서 사이버 보안의 판도를 바꿀 수 있는 능력을 관찰했기 때문입니다. '클로드 마이토스 프리뷰(Claude Mythos 2 Preview)'는 범용의 미공개 프론티어 모델로, 이 모델은 하나의 냉혹한 사실을 보여줍니다. 즉, AI 모델이 소프트웨어 취약점을 찾고 악용하는 능력에 있어서 가장 숙련된 인간을 제외한 모든 사람을 능가하는 수준의 코딩 능력에 도달했다는 것입니다. 마이토스 프리뷰는 이미 모든 주요 운영 체제와 웹 브라우저에서 일부를 포함해 수천 개의 심각한 수준(High-severity)의 취약점을 발견했습니다. AI의 발전 속도를 고려할 때, 이러한 능력이 안전한 배포에 철저히 헌신하는 주체들을 넘어 널리 퍼지는 것은 시간문제일 수 있으며, 이는 경제, 공공 안전 및 국가 안보에 심각한 피해를 초래할 수 있습니다. 프로젝트 글래스윙은 이러한 능력을 방어 목적으로 활용하기 위한 시급한 노력입니다.

프로젝트 글래스윙의 일환으로, 위에 명시된 파트너사들은 방어적 보안 작업의 일부로 마이토스 프리뷰를 사용할 것입니다. 또한 안스로픽은 우리가 배운 것을 공유하여 업계 전체가 혜택을 받을 수 있도록 할 것입니다. 우리는 또한 중요한 소프트웨어 인프라를 구축하거나 유지 관리하는 40개 이상의 추가 기관에 모델에 대한 접근 권한을 확장하여, 자사 및 오픈소스 시스템을 스캔하고 보안을 강화하는 데 사용할 수 있도록 했습니다. 안스로픽은 이러한 노력에 걸쳐 마이토스 프리뷰 사용을 위해 최대 1억 달러의 사용 크레딧을 제공하고, 오픈소스 보안 기관에 400만 달러를 직접 기부할 것을 약속합니다.

프로젝트 글래스윙은 시작점에 불과합니다. 어느 한 조직이 이러한 사이버 보안 문제를 단독으로 해결할 수는 없습니다. 프론티어 AI 개발자, 기타 소프트웨어 기업, 보안 연구원, 오픈소스 유지 관리자 및 전 세계 정부 모두가 필수적인 역할을 해야 합니다. 전 세계의 사이버 인프라를 방어하는 작업은 수년이 걸릴 수 있지만, 프론티어 AI 기능은 향후 몇 달 만에 상당히 발전할 가능성이 높습니다. 사이버 방어자들이 앞서 나가기 위해서는 지금 당장 행동해야 합니다.

AI 시대의 사이버 보안 우리 모두가 매일 의존하는 소프트웨어(은행 시스템 운영, 의료 기록 저장, 물류 네트워크 연결, 전력망 유지 등)에는 항상 버그가 존재했습니다. 많은 버그는 사소하지만, 일부는 발견될 경우 사이버 공격자가 시스템을 장악하거나, 작업을 중단시키거나, 데이터를 훔칠 수 있는 심각한 보안 결함입니다. 우리는 이미 중요한 기업 네트워크, 의료 시스템, 에너지 인프라, 교통 허브 및 전 세계 정부 기관의 정보 보안에 대한 사이버 공격의 심각한 결과를 목격했습니다. 세계 무대에서는 중국, 이란, 북한, 러시아와 같은 국가의 국가 후원 공격이 민간인의 삶과 군사 대비 태세를 뒷받침하는 인프라를 훼손하려 위협하고 있습니다. 개별 병원이나 학교가 표적이 되는 것과 같은 소규모 공격조차도 막대한 경제적 손실을 입히고, 민감한 데이터를 노출시키며, 생명을 위협할 수 있습니다. 현재 사이버 범죄로 인한 전 세계적인 재정적 비용은 추정하기 어렵지만, 매년 약 5천억 달러에 달할 것으로 보입니다.

소프트웨어의 많은 결함은 수년 동안 발견되지 않은 채 방치되곤 했습니다. 왜냐하면 그것을 찾고 악용하는 것은 극소수의 숙련된 보안 전문가만이 가진 전문 지식을 필요로 했기 때문입니다. 하지만 최신 프론티어 AI 모델을 사용하면 소프트웨어 취약점을 찾고 악용하는 데 필요한 비용, 노력 및 전문 지식 수준이 모두 극적으로 감소했습니다. 지난 1년 동안 AI 모델은 코드를 읽고 추론하는 데 있어 점점 더 효과적이 되었습니다. 특히, 취약점을 발견하고 해결책을 도출하는 놀라운 능력을 보여주고 있습니다.

원문 보기
원문 보기 (영어)
Project Glasswing Securing critical software for the AI era Continue reading Introduction Today we’re announcing Project Glasswing 1 , a new initiative that brings together Amazon Web Services, Anthropic, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, the Linux Foundation, Microsoft, NVIDIA, and Palo Alto Networks in an effort to secure the world’s most critical software. We formed Project Glasswing because of capabilities we’ve observed in a new frontier model trained by Anthropic that we believe could reshape cybersecurity. Claude Mythos 2 Preview is a general-purpose, unreleased frontier model that reveals a stark fact: AI models have reached a level of coding capability where they can surpass all but the most skilled humans at finding and exploiting software vulnerabilities. Mythos Preview has already found thousands of high-severity vulnerabilities, including some in every major operating system and web browser . Given the rate of AI progress, it will not be long before such capabilities proliferate, potentially beyond actors who are committed to deploying them safely. The fallout—for economies, public safety, and national security—could be severe. Project Glasswing is an urgent attempt to put these capabilities to work for defensive purposes. As part of Project Glasswing, the launch partners listed above will use Mythos Preview as part of their defensive security work; Anthropic will share what we learn so the whole industry can benefit. We have also extended access to a group of over 40 additional organizations that build or maintain critical software infrastructure so they can use the model to scan and secure both first-party and open-source systems. Anthropic is committing up to $100M in usage credits for Mythos Preview across these efforts, as well as $4M in direct donations to open-source security organizations. Project Glasswing is a starting point. No one organization can solve these cybersecurity problems alone: frontier AI developers, other software companies, security researchers, open-source maintainers, and governments across the world all have essential roles to play. The work of defending the world’s cyber infrastructure might take years; frontier AI capabilities are likely to advance substantially over just the next few months. For cyber defenders to come out ahead, we need to act now. Cybersecurity in the age of AI The software that all of us rely on every day—responsible for running banking systems, storing medical records, linking up logistics networks, keeping power grids functioning, and much more—has always contained bugs. Many are minor, but some are serious security flaws that, if discovered, could allow cyberattackers to hijack systems, disrupt operations, or steal data. We have already seen the serious consequences of cyberattacks for important corporate networks , healthcare systems , energy infrastructure , transport hubs , and the information security of government agencies across the world. On the global stage, state-sponsored attacks from actors like China, Iran, North Korea, and Russia have threatened to compromise the infrastructure that underpins both civilian life and military readiness. Even smaller-scale attacks, such as those where individual hospitals or schools are targeted, can still inflict substantial economic damage, expose sensitive data, and even put lives at risk. The current global financial costs of cybercrime are challenging to estimate, but might be around $500B every year. Many flaws in software go unnoticed for years because finding and exploiting them has required expertise held by only a few skilled security experts. With the latest frontier AI models, the cost, effort, and level of expertise required to find and exploit software vulnerabilities have all dropped dramatically. Over the past year , AI models have become increasingly effective at reading and reasoning about code—in particular, they show a striking ability to spot vulnerabilities and work out ways to exploit them. Claude Mythos Preview demonstrates a leap in these cyber skills—the vulnerabilities it has spotted have in some cases survived decades of human review and millions of automated security tests, and the exploits it develops are increasingly sophisticated. Ten years after the first DARPA Cyber Grand Challenge , frontier AI models are now becoming competitive with the best humans at finding and exploiting vulnerabilities. Without the necessary safeguards , these powerful cyber capabilities could be used to exploit the many existing flaws in the world’s most important software. This could make cyberattacks of all kinds much more frequent and destructive, and empower adversaries of the United States and its allies. Addressing these issues is therefore an important security priority for democratic states. Although the risks from AI-augmented cyberattacks are serious, there is reason for optimism: the same capabilities that make AI models dangerous in the wrong hands make them invaluable for finding and fixing flaws in important software—and for producing new software with far fewer security bugs. Project Glasswing is an important step toward giving defenders a durable advantage in the coming AI-driven era of cybersecurity. Identifying vulnerabilities and exploits with Claude Mythos Preview Over the past few weeks, we have used Claude Mythos Preview to identify thousands of zero-day vulnerabilities (that is, flaws that were previously unknown to the software’s developers), many of them critical, in every major operating system and every major web browser, along with a range of other important pieces of software. In a post on our Frontier Red Team blog , we provide technical details for a subset of these vulnerabilities that have already been patched and, in some cases, the ways that Mythos Preview found to exploit them. It was able to identify nearly all of these vulnerabilities—and develop many related exploits—entirely autonomously, without any human steering. The following are three examples: Mythos Preview found a 27-year-old vulnerability in OpenBSD—which has a reputation as one of the most security-hardened operating systems in the world and is used to run firewalls and other critical infrastructure. The vulnerability allowed an attacker to remotely crash any machine running the operating system just by connecting to it; It also discovered a 16-year-old vulnerability in FFmpeg—which is used by innumerable pieces of software to encode and decode video—in a line of code that automated testing tools had hit five million times without ever catching the problem; The model autonomously found and chained together several vulnerabilities in the Linux kernel—the software that runs most of the world’s servers—to allow an attacker to escalate from ordinary user access to complete control of the machine. We have reported the above vulnerabilities to the maintainers of the relevant software, and they have all now been patched. For many other vulnerabilities, we are providing a cryptographic hash of the details today (see the Red Team blog), and we will reveal the specifics after a fix is in place. Evaluation benchmarks such as CyberGym reinforce the substantial difference between Mythos Preview and our next-best model, Claude Opus 4.6: Cybersecurity Vulnerability Reproduction CyberGym Mythos Preview 83.1% Opus 4.6 66.6% In addition to our own work, many of our partners have already been using Claude Mythos Preview for several weeks. This is what they’ve found: 01 / 08 “AI capabilities have crossed a threshold that fundamentally changes the urgency required to protect critical infrastructure from cyber threats, and there is no going back. Our foundational work with these models has shown we can identify and fix security vulnerabilities across hardware and software at a pace and scale previously impossible. That is a profound shift, and a clear signal that the old ways of hardening systems are no longer sufficient. Provi