memtomem v0.2.2 · memtomem-stm v0.1.24 · Apache 2.0

잊지 않는 AI —
에이전트를 위한 장단기 기억 인프라

매 세션마다 프로젝트를 다시 설명할 필요가 없습니다. memtomem은 노트·문서·코드를 검색 가능한 기억으로 전환하여, MCP 호환 에이전트가 세션과 에이전트 경계를 넘어 동일한 기억에 접근할 수 있도록 합니다. 모든 데이터는 로컬에 유지됩니다.

$ uv tool install 'memtomem[all]'
84LTM MCP 도구
10압축 전략
12STM 제어 도구
에이전트는 왜 잊을까?
도구 통합(MCP), 안전(Guardrails), 관측성(Langfuse)은 성숙했지만 기억 계층은 아직 표준이 없습니다.
01

세션 간 기억 부재

세션이 끝나면 모든 맥락이 사라집니다. 아키텍처 결정, 코딩 패턴, 디버깅 이력을 매번 다시 설명해야 합니다.

02

에이전트 간 기억 단절

Claude Code에서 작업한 내용을 Cursor에서 이어받을 수 없습니다. 각 에이전트가 독립된 기억 사일로에 갇혀 있습니다.

03

기존 솔루션의 한계

기존 기억 시스템은 에이전트가 명시적으로 검색해야만 동작하고, 특정 런타임에 종속되며, LTM 단일 계층입니다.

memtomem이 해결합니다
인지과학의 작업기억/장기기억 모델을 에이전트에 적용. 단기 압축·캐싱과 장기 검색·인덱싱을 독립 MCP 서버로 분리합니다.

능동적 서피싱

에이전트가 직접 검색을 요청하지 않아도 됩니다. STM은 프록시된 MCP 호출을 관찰하고, v0.1.24의 mms hook은 Claude Code 네이티브 도구에도 warm daemon 기반 서피싱을 제공합니다.

MCP 프록시 게이트웨이

STM은 에이전트와 도구 사이에 투명한 프록시로 위치합니다. 기존 MCP 서버는 그대로 동작하고, LTM은 stdio, SSE, streamable HTTP 전송으로 연결할 수 있습니다.

크로스 런타임 동기화

에이전트, 스킬, 커맨드를 한 번만 정의하면 Context Gateway가 Claude Code, Codex CLI, Gemini CLI, Cursor 등 각 런타임의 네이티브 포맷으로 동기화합니다.

스마트 압축

대용량 도구 응답을 컨텍스트 윈도우 크기에 맞춰 자동으로 압축합니다. 10종 전략은 쿼리 인식 랭킹, 더 안전한 JSON 계층, 대용량 무손실 progressive 모드를 제공합니다.

멀티 에이전트 지식 공유

에이전트마다 전용 기억과 공용 기억을 함께 보유합니다. 에이전트 간 지식이 상호 이동하며, 사용자가 작성한 메모 하나를 모든 에이전트가 동시에 참조할 수 있습니다.

완전 로컬 구동

내부 구성은 SQLite + ONNX입니다. GPU, 외부 API, 클라우드 의존성이 모두 없으며, 모든 기억은 사용자 머신에만 저장됩니다.

두 계층 아키텍처
STM 프록시와 LTM 서버가 MCP로 연결되어, 에이전트에 서피싱과 압축을 투명하게 제공합니다.
AI 에이전트 / 프레임워크
Claude Code
Cursor
Codex CLI
LangGraph
MCP
memtomem-stm
STM Proxy
CLEAN → COMPRESS → SURFACE → (INDEX)
Surfacing
MCP
memtomem
LTM Server
84 MCP Tools
Upstream MCP Servers
filesystem, GitHub, …
지원 런타임 & 프레임워크
MCP 네이티브 — 모든 MCP 호환 클라이언트에서 동작합니다.
Claude Code
Cursor
Windsurf
Claude Desktop
Codex CLI
Gemini CLI
Antigravity
LangGraph
CrewAI
LangChain
문서 & 튜토리얼
시작부터 고급 활용까지.

지금 시작하세요

GPU 불필요. 외부 서비스 불필요. uv tool install 한 줄이면 됩니다.