메뉴
HN
Hacker News 3일 전

다중 에이전트 LLM 기반 자동 취약점 발견 시스템

IMP
8/10
핵심 요약

소프트웨어 보안 위협이 증가함에 따라, LLM(대형 언어 모델)을 활용해 취약점을 자동으로 탐지하고 재현하는 다중 에이전트 시스템 'FuzzingBrain V2'가 새롭게 발표되었습니다. 이 시스템은 기존 방식의 한계였던 높은 오탐지율과 복잡한 의존성 분석의 어려움을 새로운 제어 흐름 기반 추상화 및 퍼징(Fuzzing) 기술을 통해 해결합니다. 특히 실제 오픈소스 프로젝트에 적용하여 29개의 제로데이 취약점을 발견하고 패치를 이끌어냈다는 점에서 AI 기반 보안 기술의 실용성이 입증되었다는 평가를 받습니다.

번역된 본문

컴퓨터 과학 > 암호학 및 보안 arXiv:2605.21779 (cs) [2026년 5월 20일 제출]

제목: FuzzingBrain V2: 자동화된 취약점 발견 및 재현을 위한 다중 에이전트 LLM 시스템 저자: Ze Sheng, Zhicheng Chen, Qingxiao Xu, Kewen Zhu, Jeff Huang

초록: 소프트웨어 취약점은 심각한 보안 위협을 초래하며, 2025년에만 약 50,000건의 CVE(공통 취약점 및 노출)가 보고되었습니다. 최근 대형 언어 모델(LLM)이 자동화된 취약점 탐지에 유망한 성과를 보여주고 있지만, 여전히 세 가지 핵심적인 과제가 남아 있습니다. 첫째, LLM이 생성한 취약점 보고서는 높은 오탐지율(False Positive)을 보이며, 재현 가능한 검증이 부족합니다. 둘째, 기존 LLM 기반 접근 방식은 취약점 위치 파악에 있어 최적화되지 않은 세분성(Granularity)을 사용합니다. 함수 수준 분석은 문맥이 방대해질 때 버그를 간과하고, 라인 수준 분석은 충분한 문맥을 제공하지 못합니다. 셋째, 기존 접근 방식은 복잡한 교차 함수 의존성(Cross-function dependencies)과 트리거링 조건을 가진 취약점을 추론하는 데 어려움을 겪습니다.

이러한 문제를 해결하기 위해 본 논문에서는 네 가지 핵심 기여를 하는 다중 에이전트 시스템인 'FuzzingBrain V2'를 제안합니다: (1) 구글의 OSS-Fuzz를 기반으로 구축된 완전 자동화된 취약점 분석을 통해, 보고된 모든 취약점이 퍼저(Fuzzer)로 재현 가능함을 보장합니다. (2) 최적의 세분성에서 정확한 취약점 위치 파악을 위한 새로운 제어 흐름 기반 추상화인 '의심 스위치(Suspicious Point)'를 도입합니다. (3) 이중 레이어 퍼징(Dual-layer fuzzing)을 통한 논리 기반 계층적 함수 분석을 통해, 리소스 제약 조건 내에서 함수 커버리지를 극대화합니다. (4) 정적 및 동적 분석 도구와 문맥 엔지니어링(Context Engineering)을 결합하여 복잡한 취약점 추론 능력을 강화합니다.

AIxCC 2025 최종 경진대회 C/C++ 데이터셋에서 FuzzingBrain V2는 90%의 탐지율을 기록했습니다(40개 취약점 중 36개 탐지). 또한 실제 환경에 배포되어 12개의 오픈소스 프로젝트에서 29개의 제로데이(Zero-day) 취약점을 발견했습니다. 이 취약점들은 프로젝트 유지 관리자에 의해 모두 확인 및 수정되었으며, 그중 2개에는 공식 CVE ID가 부여되었습니다.

원문 보기
원문 보기 (영어)
--> Computer Science > Cryptography and Security arXiv:2605.21779 (cs) [Submitted on 20 May 2026] Title: FuzzingBrain V2: A Multi-Agent LLM System for Automated Vulnerability Discovery and Reproduction Authors: Ze Sheng , Zhicheng Chen , Qingxiao Xu , Kewen Zhu , Jeff Huang View a PDF of the paper titled FuzzingBrain V2: A Multi-Agent LLM System for Automated Vulnerability Discovery and Reproduction, by Ze Sheng and 4 other authors View PDF HTML (experimental) Abstract: Software vulnerabilities pose critical security threats, with nearly 50,000 CVEs reported in 2025. While Large Language Models (LLMs) show promise for automated vulnerability detection, three key challenges remain. First, LLM-generated vulnerability reports suffer from high false positive rates and lack reproducible verification. Second, existing LLM-based approaches use suboptimal granularities for vulnerability localization: function-level analysis overlooks bugs when context becomes extensive, while line-level analysis lacks sufficient context. Third, existing approaches have difficulty reasoning about vulnerabilities with complex cross-function dependencies and triggering conditions. We present FuzzingBrain V2, a multi-agent system that addresses these gaps through four key contributions: (1) fully automated vulnerability analysis built on Google's OSS-Fuzz, ensuring all reported vulnerabilities are fuzzer-reproducible; (2) Suspicious Point, a novel control-flow-based abstraction for precise vulnerability localization at the optimal granularity; (3) logic-driven hierarchical function analysis with dual-layer fuzzing enhancing function coverage under resource constraints; (4) MCP-based static and dynamic analysis tools with context engineering enhancing complex vulnerability reasoning. On the AIxCC 2025 Final Competition C/C++ dataset, FuzzingBrain V2 achieved 90% detection rate (36 of 40 vulnerabilities). In real-world deployment, FuzzingBrain V2 discovered 29 zero-day vulnerabilities across 12 open-source projects, all confirmed and fixed by maintainers, with 2 assigned CVE IDs. Subjects: Cryptography and Security (cs.CR) ; Software Engineering (cs.SE) Cite as: arXiv:2605.21779 [cs.CR] (or arXiv:2605.21779v1 [cs.CR] for this version) https://doi.org/10.48550/arXiv.2605.21779 Focus to learn more arXiv-issued DOI via DataCite (pending registration) Submission history From: Ze Sheng [ view email ] [v1] Wed, 20 May 2026 22:17:14 UTC (1,827 KB) Full-text links: Access Paper: View a PDF of the paper titled FuzzingBrain V2: A Multi-Agent LLM System for Automated Vulnerability Discovery and Reproduction, by Ze Sheng and 4 other authors View PDF HTML (experimental) TeX Source view license Current browse context: cs.CR < prev | next > new | recent | 2026-05 Change to browse by: cs cs.SE References & Citations NASA ADS Google Scholar Semantic Scholar export BibTeX citation Loading... BibTeX formatted citation &times; loading... Data provided by: Bookmark Bibliographic Tools Bibliographic and Citation Tools Bibliographic Explorer Toggle Bibliographic Explorer ( What is the Explorer? ) Connected Papers Toggle Connected Papers ( What is Connected Papers? ) Litmaps Toggle Litmaps ( What is Litmaps? ) scite.ai Toggle scite Smart Citations ( What are Smart Citations? ) Code, Data, Media Code, Data and Media Associated with this Article alphaXiv Toggle alphaXiv ( What is alphaXiv? ) Links to Code Toggle CatalyzeX Code Finder for Papers ( What is CatalyzeX? ) DagsHub Toggle DagsHub ( What is DagsHub? ) GotitPub Toggle Gotit.pub ( What is GotitPub? ) Huggingface Toggle Hugging Face ( What is Huggingface? ) ScienceCast Toggle ScienceCast ( What is ScienceCast? ) Demos Demos Replicate Toggle Replicate ( What is Replicate? ) Spaces Toggle Hugging Face Spaces ( What is Spaces? ) Spaces Toggle TXYZ.AI ( What is TXYZ.AI? ) Related Papers Recommenders and Search Tools Link to Influence Flower Influence Flower ( What are Influence Flowers? ) Core recommender toggle CORE Recommender ( What is CORE? ) Author Venue Institution Topic About arXivLabs arXivLabs: experimental projects with community collaborators arXivLabs is a framework that allows collaborators to develop and share new arXiv features directly on our website. Both individuals and organizations that work with arXivLabs have embraced and accepted our values of openness, community, excellence, and user data privacy. arXiv is committed to these values and only works with partners that adhere to them. Have an idea for a project that will add value for arXiv's community? Learn more about arXivLabs . Which authors of this paper are endorsers? | Disable MathJax ( What is MathJax? )