콘텐츠로 이동

압축 전략

memtomem-stm은 MCP 도구 응답을 콘텐츠 유형에 따라 자동으로 압축하여 토큰을 절감합니다. 에이전트에게 필요한 정보를 잃지 않으면서 응답 크기를 줄이는 10가지 전략을 제공합니다.

전략대상 콘텐츠동작
truncate소형 텍스트길이 제한 절삭 (기본 폴백)
hybridMarkdown구조 보존 + 불필요 섹션 축약
selective일반 텍스트쿼리와 관련된 부분만 보존
progressive대형 콘텐츠커서 기반 순차 전달 (제로 정보손실)
extract_fieldsJSON 딕셔너리주요 필드만 추출
schema_pruningJSON 배열스키마 유지 + 샘플 축소
skeletonAPI 문서구조 뼈대만 보존
llm_summary복잡한 텍스트LLM 기반 요약 (Ollama/OpenAI)
auto모든 유형콘텐츠 분석 후 최적 전략 자동 선택
none압축 없이 원본 전달

auto 전략(기본값)은 콘텐츠를 분석하여 최적 전략을 선택합니다:

콘텐츠 유형선택되는 전략
JSON 딕셔너리extract_fields
대형 JSON 배열schema_pruning
Markdown 문서hybrid
API 문서skeleton
소형 텍스트 (< 임계값)truncate
기타 대형 텍스트selective

압축 시 에이전트의 현재 쿼리를 인식하여, 관련 섹션에 더 많은 토큰 예산을 할당합니다. 예를 들어, “인증 모듈”에 대해 질문한 상태에서 API 문서를 압축하면, 인증 관련 엔드포인트에 더 많은 공간을 배분합니다.

progressive 전략은 대형 콘텐츠를 정보 손실 없이 전달합니다:

  1. 첫 응답에서 목차(TOC)와 첫 번째 청크 전달
  2. 에이전트가 추가 부분을 요청하면 커서 기반으로 다음 청크 전달
  3. 전체 내용을 순차적으로 확인 가능

압축 비율 가드레일(기본 65% 보존)을 위반하면 3단계 폴백이 자동 동작합니다:

progressive → hybrid → truncate

각 단계에서 가드레일을 충족하면 해당 전략으로 응답합니다.

에이전트의 피드백으로 도구별 압축 예산을 자동 조정합니다:

  • 에이전트가 정보 손실을 보고하면 → 해당 도구의 보존 비율 상향
  • 에이전트가 응답이 너무 길다고 하면 → 보존 비율 하향