콘텐츠로 이동

압축 전략

memtomem-stm은 MCP 도구 응답을 콘텐츠 유형에 따라 자동으로 압축하여 토큰을 절감합니다. 에이전트에게 필요한 정보를 잃지 않으면서 응답 크기를 줄이는 10가지 전략을 제공합니다.

10가지 압축 전략

전략	대상 콘텐츠	동작
truncate	소형 텍스트	길이 제한 절삭 (기본 폴백)
hybrid	Markdown	구조 보존 + 불필요 섹션 축약
selective	일반 텍스트	쿼리와 관련된 부분만 보존
progressive	대형 콘텐츠	커서 기반 순차 전달 (제로 정보손실)
extract_fields	JSON 딕셔너리	주요 필드만 추출
schema_pruning	JSON 배열	스키마 유지 + 샘플 축소
skeleton	API 문서	구조 뼈대만 보존
llm_summary	복잡한 텍스트	LLM 기반 요약 (Ollama/OpenAI)
auto	모든 유형	콘텐츠 분석 후 최적 전략 자동 선택
none	—	압축 없이 원본 전달

자동 선택 로직

auto 전략(기본값)은 콘텐츠를 분석하여 최적 전략을 선택합니다:

콘텐츠 유형	선택되는 전략
JSON 딕셔너리	`extract_fields`
대형 JSON 배열	`schema_pruning`
Markdown 문서	`hybrid`
API 문서	`skeleton`
소형 텍스트 (< 임계값)	`truncate`
기타 대형 텍스트	`selective`

쿼리 인식 예산 배분

압축 시 에이전트의 현재 쿼리를 인식하여, 관련 섹션에 더 많은 토큰 예산을 할당합니다. 예를 들어, “인증 모듈”에 대해 질문한 상태에서 API 문서를 압축하면, 인증 관련 엔드포인트에 더 많은 공간을 배분합니다.

제로 정보손실: Progressive Delivery

progressive 전략은 대형 콘텐츠를 정보 손실 없이 전달합니다:

첫 응답에서 목차(TOC)와 첫 번째 청크 전달
에이전트가 추가 부분을 요청하면 커서 기반으로 다음 청크 전달
전체 내용을 순차적으로 확인 가능

폴백 래더

압축 비율 가드레일(기본 65% 보존)을 위반하면 3단계 폴백이 자동 동작합니다:

progressive → hybrid → truncate

각 단계에서 가드레일을 충족하면 해당 전략으로 응답합니다.

압축 예산 설정

에이전트의 피드백으로 도구별 압축 예산을 자동 조정합니다:

에이전트가 정보 손실을 보고하면 → 해당 도구의 보존 비율 상향
에이전트가 응답이 너무 길다고 하면 → 보존 비율 하향