메뉴

#RAG

HN
Hacker News 4일 전
IMP 7

AI 에이전트 기억 시스템의 구조와 원리

현재 다수의 AI 에이전트 메모리 라이브러리들이 인지과학의 용어를 차용해 쓰고 있지만, 실제 엔지니어링 구현은 그 의미를 제대로 반영하지 못하고 있습니다. 이 글은 에이전트의 기억 시스템이 대화에서 정보를 추출하는 '추출기', 데이터를 저장하고 모순을 처리하는 '저장소', 필요한 정보를 검색하는 '검색기'라는 세 가지 핵심 구성 요소로 이루어져 있음을 설명합니다. 개발자들은 이 세 가지 구조의 동작 방식과 설계 선택(정보 압축, 모순 처리 등)을 이해함으로써 어떤 메모리 라이브러리든 평가하고 활용할 수 있습니다.

에이전트 메모리 LLM 아키텍처 RAG
MP
MarkTechPost 7일 전
IMP 8

텐센트, 4계층 로컬 메모리 파이프라인 오픈소스화

텐센트가 AI 에이전트를 위한 완전한 로컬 기반 메모리 시스템인 'TencentDB Agent Memory'를 MIT 라이선스로 오픈소스화했습니다. 이 시스템은 심볼릭 단기 메모리와 4계층(L0~L3) 장기 메모리 피라미드를 결합하여 토큰 사용량을 61.38% 줄이고 작업 성공률을 크게 향상시켰습니다. 기본적으로 로컬 환경에서 작동하여 외부 클라우드 종속성 없이 AI 에이전트의 기억력과 효율성을 높일 수 있다는 점이 가장 큰 의의입니다.

텐센트 AI 에이전트 오픈소스
MP
MarkTechPost 10일 전
IMP 6

구글 TurboQuant 기반 고속 벡터 인덱스, Turbovec

Turbovec는 구글 리서치의 TurboQuant 알고리즘을 도입하여 16배 압축과 코드북 학습 불필요(Zero codebook training)의 강점을 제공하는 새로운 벡터 인덱스입니다. Rust로 구현되어 고성능을 자랑하며 Python 바인딩을 제공해 RAG 파이프라인 구축에 최적화되어 있습니다.

벡터 검색 RAG 데이터 압축
MP
MarkTechPost 20일 전
IMP 8

2026년 주요 9개 벡터 DB 아키텍처와 가격 비교

RAG와 에이전트 AI 환경에서 필수적인 인프라로 자리 잡은 벡터 데이터베이스를 주요 9개 제품을 대상으로 비교 분석한 글입니다. 각 시스템의 아키텍처, 가격 정책, 확장성 한계 등 실무적인 기준을 제시하여 기술 선택을 돕습니다. AI 검색 및 생산성 향상을 위한 백엔드 인프라 구축 담당자들에게 중요한 인사이트를 제공합니다.

벡터 데이터베이스 RAG 에이전트 AI
HN
Hacker News 21일 전
IMP 8

제미나이 API 파일 검색, 멀티모달 완벽 지원

구글 딥마인드가 제미나이(Gemini) API의 파일 검색(File Search) 도구에 멀티모달 데이터 처리, 커스텀 메타데이터, 페이지 수준의 출처 인용 기능 등 세 가지 주요 업데이트를 도입했습니다. 이를 통해 개발자들은 텍스트와 이미지를 동시에 이해하는 정확하고 투명한 RAG(검색 증강 생성) 시스템을 구축할 수 있게 되었습니다. 이번 업데이트는 대규모 비정형 데이터를 다루는 실무자들에게 검색 정확도와 결과의 신뢰성을 획기적으로 높여준다는 점에서 중요합니다.

제미나이 API 멀티모달 RAG
SG
r/singularity 24일 전
IMP 8

서브쿼드래틱, LLM 확장 한계 돌파 주장…비용 최대 1000倍 절감

전 구글 딥마인드와 메타 엔지니어들이 설립한 스타트업 '서브쿼드래틱(Subquadratic)'이 기존 대비 처리 비용을 1,000분의 1 수준으로 줄이는 새로운 AI 아키텍처를 발표했습니다. 이 모델은 데이터가 늘어나도 연산량이 비례해서 증가하는 선형 스케일링(Linear scaling)을 채택해 최대 1,200만 토큰의 컨텍스트 윈도우를 처리할 수 있다고 주장합니다. 비즈니스 측면에서 이 기술이 검증된다면 RAG(검색 증강 생성) 파이프라인이 불필요해질 수 있으나, 독립적인 동료 평가나 성능 저하 검증이 부족하다는 산업계의 비판적 시각도 존재합니다.

LLM 아키텍처 비용 효율화 선형 스케일링
HN
Hacker News 34일 전
IMP 7

생물학적 망각 곡선을 적용한 AI 메모리 (52% 회상률 달성)

에빙하우스의 망각 곡선을 적용해 AI 에이전트의 문맥을 생물학적 기억처럼 관리하는 오픈소스 로컬 MCP 서버가 공개되었습니다. 단순히 정보를 영구 저장하는 기존 RAG의 한계를 극복하고 그래프 레이어를 결합하여 벤치마크에서 52%의 높은 회상률과 84%의 토큰 절감 효과를 입증했습니다. 장기 프로젝트를 수행하는 AI 에이전트에게 '무엇을 잊을지' 결정하는 것이 '무엇을 기억할지'만큼 중요하다는 점을 강력히 시사합니다.

RAG 에이전트 메모리 망각 곡선
HN
Hacker News 36일 전
IMP 7

클로드·챗GPT처럼 기억하는 오픈소스 AI 메모리 레이어

Hacker News에 'Stash'라는 오픈소스 AI 메모리 레이어 프로젝트가 소개되었습니다. 이 도구는 PostgreSQL과 pgvector 기반으로 작동하며, 어떤 AI 에이전트든 사용자와의 대화 맥락과 선호도를 영구적으로 기억할 수 있게 해줍니다. 기존의 단순한 문서 검색(RAG)과 달리, 폴더처럼 체계적으로 메모리를 관리하고 에피소드를 패턴과 지혜로 발전시키는 '두 번째 뇌' 역할을 합니다.

에이전트 메모리 오픈소스
HN
Hacker News 56일 전
IMP 7

LLM 위키: 개인 지식 베이스 구축 패턴

이 글은 매번 검색어를 조회할 때마다 처음부터 답을 찾는 기존 RAG 방식의 한계를 지적하며, LLM이 원문을 바탕으로 지속 가능하고 상호 연결된 개인 위키를 점진적으로 구축 및 유지 관리하는 새로운 패턴을 제안합니다. LLM이 단순한 문서 검색을 넘어 요약, 교차 참조, 정보 갱신 등의 편집 작업을 자동으로 수행하여, 사용자가 옵시디언(Obsidian) 같은 도구와 함께 지식을 체계적으로 축적할 수 있게 해줍니다.

LLM 지식베이스 RAG