다중 에이전트 LLM 기반 자동 취약점 발견 시스템
소프트웨어 보안 위협이 증가함에 따라, LLM(대형 언어 모델)을 활용해 취약점을 자동으로 탐지하고 재현하는 다중 에이전트 시스템 'FuzzingBrain V2'가 새롭게 발표되었습니다. 이 시스템은 기존 방식의 한계였던 높은 오탐지율과 복잡한 의존성 분석의 어려움을 새로운 제어 흐름 기반 추상화 및 퍼징(Fuzzing) 기술을 통해 해결합니다. 특히 실제 오픈소스 프로젝트에 적용하여 29개의 제로데이 취약점을 발견하고 패치를 이끌어냈다는 점에서 AI 기반 보안 기술의 실용성이 입증되었다는 평가를 받습니다.
컴퓨터 과학 > 암호학 및 보안 arXiv:2605.21779 (cs) [2026년 5월 20일 제출]
제목: FuzzingBrain V2: 자동화된 취약점 발견 및 재현을 위한 다중 에이전트 LLM 시스템 저자: Ze Sheng, Zhicheng Chen, Qingxiao Xu, Kewen Zhu, Jeff Huang
초록: 소프트웨어 취약점은 심각한 보안 위협을 초래하며, 2025년에만 약 50,000건의 CVE(공통 취약점 및 노출)가 보고되었습니다. 최근 대형 언어 모델(LLM)이 자동화된 취약점 탐지에 유망한 성과를 보여주고 있지만, 여전히 세 가지 핵심적인 과제가 남아 있습니다. 첫째, LLM이 생성한 취약점 보고서는 높은 오탐지율(False Positive)을 보이며, 재현 가능한 검증이 부족합니다. 둘째, 기존 LLM 기반 접근 방식은 취약점 위치 파악에 있어 최적화되지 않은 세분성(Granularity)을 사용합니다. 함수 수준 분석은 문맥이 방대해질 때 버그를 간과하고, 라인 수준 분석은 충분한 문맥을 제공하지 못합니다. 셋째, 기존 접근 방식은 복잡한 교차 함수 의존성(Cross-function dependencies)과 트리거링 조건을 가진 취약점을 추론하는 데 어려움을 겪습니다.
이러한 문제를 해결하기 위해 본 논문에서는 네 가지 핵심 기여를 하는 다중 에이전트 시스템인 'FuzzingBrain V2'를 제안합니다: (1) 구글의 OSS-Fuzz를 기반으로 구축된 완전 자동화된 취약점 분석을 통해, 보고된 모든 취약점이 퍼저(Fuzzer)로 재현 가능함을 보장합니다. (2) 최적의 세분성에서 정확한 취약점 위치 파악을 위한 새로운 제어 흐름 기반 추상화인 '의심 스위치(Suspicious Point)'를 도입합니다. (3) 이중 레이어 퍼징(Dual-layer fuzzing)을 통한 논리 기반 계층적 함수 분석을 통해, 리소스 제약 조건 내에서 함수 커버리지를 극대화합니다. (4) 정적 및 동적 분석 도구와 문맥 엔지니어링(Context Engineering)을 결합하여 복잡한 취약점 추론 능력을 강화합니다.
AIxCC 2025 최종 경진대회 C/C++ 데이터셋에서 FuzzingBrain V2는 90%의 탐지율을 기록했습니다(40개 취약점 중 36개 탐지). 또한 실제 환경에 배포되어 12개의 오픈소스 프로젝트에서 29개의 제로데이(Zero-day) 취약점을 발견했습니다. 이 취약점들은 프로젝트 유지 관리자에 의해 모두 확인 및 수정되었으며, 그중 2개에는 공식 CVE ID가 부여되었습니다.