Problem

에이전트는 왜 잊을까?

도구 연동(MCP), 안전장치(Guardrails), 관측(Langfuse)은 이미 자리를 잡았지만, ‘기억’만큼은 아직 표준이 없습니다.

01

세션 간 기억 부재

세션이 끝나면 모든 맥락이 사라집니다. 아키텍처 결정, 코딩 패턴, 디버깅 이력을 매번 다시 설명해야 합니다.

02

에이전트 간 기억 단절

Claude Code에서 작업한 내용을 Cursor에서 이어받을 수 없습니다. 각 에이전트가 독립된 기억 사일로에 갇혀 있습니다.

03

기존 솔루션의 한계

기존 기억 시스템은 에이전트가 직접 검색해야만 동작하고, 특정 런타임에 묶여 있으며, 장기 기억 한 계층에 그칩니다.

Solution

memtomem이 해결합니다

인지과학의 작업기억·장기기억 모델을 에이전트에 적용했습니다. 단기 압축·캐싱과 장기 검색·인덱싱을 별도의 MCP 서버로 분리했습니다.

장기 기억 검색

노트·문서·코드를 mm index로 색인하면, BM25 키워드 검색과 벡터 의미 검색을 RRF로 융합해 정확한 식별자와 의미 기반 질의를 한 번에 검색합니다. 마크다운·코드·구조화 문서는 구조 단위로 잘라 색인하고, 다시 색인할 때는 바뀐 조각만 임베딩을 새로 계산합니다.

세션·에이전트 경계를 넘어

기억은 세션이 끝나도 사라지지 않습니다. 네임스페이스로 에이전트별 비공개 공간과 shared 공유 공간을 나누고, 세션 워크플로우로 한 에이전트가 정리한 지식을 다른 에이전트가 이어받습니다. Claude Code·Cursor·Codex가 하나의 기억 저장소를 공유합니다.

스킬·커맨드·서브에이전트를 정규 .memtomem/ 소스 하나에서 각 AI 런타임으로 동기화합니다. mm web의 Simple 화면에서 항목별 Sync·Import를 한 번에 처리하고, mm context copy·move로 프로젝트·계층 간 이동하며, mm context sync --all-projects로 여러 프로젝트를 일괄 동기화합니다.

능동적 서피싱

에이전트가 먼저 검색을 요청하지 않아도, STM이 오가는 도구 호출을 살펴 관련 기억을 알맞은 순간에 찾아 붙여 줍니다. 붙여 준 기억마다 식별자가 있어, 에이전트가 항목별로 유용성을 평가하거나 무시할 수 있습니다.

토큰 인식 압축

모든 MCP 도구 응답은 에이전트에 도달하기 전 STM을 거칩니다. 컨텍스트 예산을 초과하면 콘텐츠 유형에 맞춰 10종 전략 중 하나가 자동(auto)으로 선택되어 토큰을 줄입니다. 현재 질의를 반영해 관련 섹션에 더 큰 예산을 배분하므로 꼭 필요한 정보는 보존됩니다.

완전 로컬 · 비공개

내부 구성은 SQLite + ONNX이며 GPU·외부 API·클라우드 의존성이 없습니다. SQLite 파일은 0600 권한으로 보호되고, 자격증명처럼 보이는 응답은 캐시나 색인에 저장되기 전에 걸러집니다. STM 프록시는 mms eject로 언제든 원래 설정으로 되돌릴 수 있어 잠금(lock-in)이 없습니다.

Architecture

두 계층 아키텍처

STM 프록시와 LTM 서버가 MCP로 연결되어, 에이전트에 서피싱과 압축을 투명하게 제공합니다.

주요 AI 런타임 / 기타

Claude Code

Codex CLI

Antigravity CLI

기타 MCP 클라이언트

MCP

memtomem-stm

STM Proxy

CLEAN → COMPRESS → SURFACE → (INDEX)

Surfacing

MCP

memtomem

LTM Server

9 core MCP Tools

Upstream MCP Servers

filesystem, GitHub, …

Compatibility

주요 런타임 & 호환성

주요 CLI 런타임에 맞춰 최적화하고, 그 밖의 클라이언트는 MCP 표준으로 지원합니다.

Claude Code

Codex CLI

Antigravity CLI

기타 MCP 클라이언트

프레임워크 어댑터

Documentation

문서 & 튜토리얼

시작부터 고급 활용까지.

잊지 않는 AI —
에이전트를 위한 장단기 기억 인프라

세션 간 기억 부재

에이전트 간 기억 단절

기존 솔루션의 한계

장기 기억 검색

세션·에이전트 경계를 넘어

Context Gateway

능동적 서피싱

토큰 인식 압축

완전 로컬 · 비공개

Quick Start

하이브리드 검색

압축 전략 가이드

능동적 서피싱

멀티 에이전트 협업

Context Gateway

지금 시작하세요

잊지 않는 AI —에이전트를 위한 장단기 기억 인프라

세션 간 기억 부재

에이전트 간 기억 단절

기존 솔루션의 한계

장기 기억 검색

세션·에이전트 경계를 넘어

Context Gateway

능동적 서피싱

토큰 인식 압축

완전 로컬 · 비공개

Quick Start

하이브리드 검색

압축 전략 가이드

능동적 서피싱

멀티 에이전트 협업

Context Gateway

지금 시작하세요

잊지 않는 AI —
에이전트를 위한 장단기 기억 인프라