AI 어시스턴트, RAG 대신 가상 파일시스템 도입
문서 검색에 쓰이는 전통적인 RAG 방식의 한계(정확한 문법 누락, 다중 페이지 탐색 불가 등)를 극복하고자 가상 파일시스템인 ChromaFs를 도입한 사례입니다. 이를 통해 샌드박스 컨테이너 생성에 걸리던 46초의 지연 시간을 100밀리초로 단축하고 연간 7만 달러 이상의 인프라 비용을 절감했습니다. 기존 DB 인프라를 재사용해 추가 비용 없이 에이전트가 셸 명령어(ls, grep 등)로 문서를 탐색할 수 있게 한 것이 핵심입니다.
모든 기사 엔지니어링 / 5분 읽기
우리는 AI 어시스턴트를 위한 가상 파일시스템을 어떻게 구축했는가 2026년 3월 24일 DS Dens Sumesh 엔지니어링 이 기사 공유하기
RAG(검색 증강 생성)는 완벽해 보이지만, 그렇지 않을 때가 있습니다. 우리의 어시스턴트는 쿼리와 일치하는 텍스트 청크만 검색할 수 있었습니다. 정답이 여러 페이지에 걸쳐 있거나, 사용자가 Top-K 결과에 포함되지 않은 정확한 구문이 필요한 경우에는 어시스턴트가 해결할 수 없었습니다. 우리는 어시스턴트가 코드베이스를 탐색하듯 문서를 탐색하기를 원했습니다.
에이전트는 파일시스템을 기본 인터페이스로 수렴하고 있습니다. 왜냐하면 grep, cat, ls, find가 에이전트에 필요한 전부이기 때문입니다. 각 문서 페이지가 파일이고 각 섹션이 디렉토리라면, 에이전트는 정확한 문자열을 검색하고, 전체 페이지를 읽고, 스스로 구조를 탐색할 수 있습니다. 우리는 실시간 문서 사이트를 반영하는 파일시스템이 필요했습니다.
컨테이너 병목 현상 이를 구현하는 가장 명확한 방법은 에이전트에 실제 파일시스템을 제공하는 것입니다. 대부분의 프레임워크는 격리된 샌드박스를 실행하고 리포지토리를 복제하여 이를 해결합니다. 우리는 이미 지연 시간이 크게 중요하지 않은 비동기 백그라운드 에이전트를 위해 샌드박스를 사용하고 있지만, 사용자가 로딩 스피너를 쳐다보고 있는 프론트엔드 어시스턴트의 경우 이 방식은 한계에 부딪힙니다. P90 세션 생성 시간(GitHub 클론 및 기타 설정 포함)은 약 46초였습니다. 지연 시간을 넘어, 정적 문서를 읽기 위해 전용 마이크로 VM을 사용하는 것은 막대한 인프라 비용을 초래했습니다. 월 85만 건의 대화가 발생하는 상황에서 최소한의 설정(1 vCPU, 2GiB RAM, 5분 세션 수명)만으로도 Daytona의 초당 샌드박스 요금 책정에 따라 연간 $70,000 이상의 비용이 듭니다. 세션 시간이 길어지면 비용은 두 배로 증가합니다.(이는 순진한 계산에 기반한 것이며, 실제 프로덕션에서는 웜 풀과 컨테이너 공유를 사용하겠지만, 요점은 동일합니다.)
우리는 파일시스템 워크플로우가 즉각적이고 저렴해야 했고, 이는 파일시스템 자체를 다시 생각해야 함을 의미했습니다.
셸(Shell) 속이기 에이전트는 실제 파일시스템이 필요하지 않습니다. 단지 그럴듯한 환상만 필요할 뿐입니다. 우리의 문서는 이미 검색을 지원하기 위해 Chroma 데이터베이스에 인덱싱, 청킹 및 저장되어 있었습니다. 따라서 UNIX 명령을 가로채어 이를 동일한 데이터베이스에 대한 쿼리로 변환하는 가상 파일시스템인 ChromaFs를 구축했습니다. 세션 생성 시간은 약 46초에서 약 100밀리초로 감소했으며, ChromaFs는 이미 지불한 인프라를 재사용하므로 대화당 추가 컴퓨팅 비용은 0입니다.
ChromaFs는 Vercel Labs의 just-bash(Malte에게 찬사를!) 위에 구축되었습니다. 이는 TypeScript로 재구현된 bash로, grep, cat, ls, find 및 cd를 지원합니다. just-bash는 플러그 가능한 IFileSystem 인터페이스를 노출하므로 모든 구문 분석, 파이핑 및 플래그 논리를 처리하고, ChromaFs는 모든 기본 파일시스템 호출을 Chroma 쿼리로 변환합니다.
작동 방식 디렉토리 트리 부트스트래핑 ChromaFs는 에이전트가 단일 명령을 실행하기 전에 어떤 파일이 존재하는지 알아야 합니다. 우리는 전체 파일 트리를 Chroma 컬렉션 내부의 gzip으로 압축된 JSON 문서(path_tree)로 저장합니다:
{ "auth/oauth": { "isPublic": true, "groups": [] }, "auth/api-keys": { "isPublic": true, "groups": [] }, "internal/billing": { "isPublic": false, "groups": [ "admin", "billing" ] }, "api-reference/endpoints/users": { "isPublic": true, "groups": [] } }
초기화 시 서버는 이 문서를 가져와 압축을 풀고 두 개의 인메모리 구조(파일 경로의 Set