메뉴
HN
Hacker News 34일 전

생물학적 망각 곡선을 적용한 AI 메모리 (52% 회상률 달성)

IMP
7/10
핵심 요약

에빙하우스의 망각 곡선을 적용해 AI 에이전트의 문맥을 생물학적 기억처럼 관리하는 오픈소스 로컬 MCP 서버가 공개되었습니다. 단순히 정보를 영구 저장하는 기존 RAG의 한계를 극복하고 그래프 레이어를 결합하여 벤치마크에서 52%의 높은 회상률과 84%의 토큰 절감 효과를 입증했습니다. 장기 프로젝트를 수행하는 AI 에이전트에게 '무엇을 잊을지' 결정하는 것이 '무엇을 기억할지'만큼 중요하다는 점을 강력히 시사합니다.

번역된 본문

대부분의 RAG 설정은 기억을 단순한 정적 파일 캐비닛처럼 취급하기 때문에 실패합니다. 일시적인 버그 수정이나 폐기된 규칙 같은 모든 데이터가 영원히 저장되면, 결국 컨텍스트 윈도우(Context Window)는 노이즈로 인해 포화 상태가 되어 토큰 비용은 급증하고 에이전트의 추론 능력은 저하됩니다.

이 구현체는 에빙하우스의 망각 곡선(Forgetting Curve)을 활용하여 문맥을 살아있는 기질처럼 관리하는 생물학적 접근 방식을 실험합니다. 기억에는 '강도(Strength)' 점수가 할당되며, 데이터가 회상될 때마다 정보가 강화되고 망각 곡선이 완만해지는 간격 반복(Spaced repetition) 원리를 적용합니다. 반면 사용되지 않은 데이터는 결국 임계값에 도달하여 가지치기(Pruning)됩니다.

의미론적 검색(Semantic search)이 관련성은 있지만 표면적으로 유사하지는 않은 노드를 놓치는 '논리적 이웃(Logical neighbor)' 문제를 해결하기 위해, 벡터 스토어(Vector Store) 위에 그래프 레이어(Graph layer)를 추가했습니다. LoCoMo 데이터셋을 사용한 벤치마크에서 이 시스템은 52%의 Recall@5를 달성하여 상태 비저장(Stateless) 벡터 스토어보다 정확도가 거의 두 배에 달했으며, 토큰 낭비는 약 84%나 줄였습니다.

DuckDB를 사용하여 로컬 우선(Local first) MCP 서버로 구축된 이 프로젝트의 핵심 가설은, 장기 실행 프로젝트를 처리하는 에이전트의 경우 '무엇을 잊을 것인가'가 '무엇을 기억할 것인가'만큼 중요하다는 것입니다. 다른 개발자들도 문맥 관리를 위해 비선형 감소(Non-linear decay)나 유사한 생물학적 제약 조건을 탐구하고 있는지 관심이 많습니다.

GitHub: https://github.com/sachitrafa/cognitive-ai-memory

원문 보기
원문 보기 (영어)
Most RAG setups fail because they treat memory like a static filing cabinet. When every transient bug fix or abandoned rule is stored forever, the context window eventually chokes on noise, spiking token costs and degrading the agent&#x27;s reasoning.<p>This implementation experiments with a biological approach by using the Ebbinghaus forgetting curve to manage context as a living substrate. Memories are assigned a &quot;strength&quot; score where each recall reinforces the data and flattens its decay curve (spaced repetition), while unused data eventually hits a threshold and is pruned.<p>To solve the &quot;logical neighbor&quot; problem where semantic search misses relevant but non-similar nodes, a graph layer is layered over the vector store. Benchmarked against the LoCoMo dataset, this reached 52% Recall@5, nearly double the accuracy of stateless vector stores, while cutting token waste by roughly 84%.<p>Built as a local first MCP server using DuckDB, the hypothesis is that for agents handling long-running projects, &quot;what to forget&quot; is just as critical as &quot;what to remember.&quot; I&#x27;d be interested to hear if others are exploring non-linear decay or similar biological constraints for context management.<p>GitHub: <a href="https:&#x2F;&#x2F;github.com&#x2F;sachitrafa&#x2F;cognitive-ai-memory" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;sachitrafa&#x2F;cognitive-ai-memory</a>