압축 전략
memtomem-stm은 MCP 도구 응답을 콘텐츠 유형에 따라 자동으로 압축하여 토큰을 절감합니다. 에이전트에게 필요한 정보를 잃지 않으면서 응답 크기를 줄이는 10가지 전략을 제공합니다.
10가지 압축 전략
섹션 제목: “10가지 압축 전략”| 전략 | 대상 콘텐츠 | 동작 |
|---|---|---|
| truncate | 소형 텍스트 | 길이 제한 절삭 (기본 폴백) |
| hybrid | Markdown | 구조 보존 + 불필요 섹션 축약 |
| selective | 일반 텍스트 | 쿼리와 관련된 부분만 보존 |
| progressive | 대형 콘텐츠 | 커서 기반 순차 전달 (제로 정보손실) |
| extract_fields | JSON 딕셔너리 | 주요 필드만 추출 |
| schema_pruning | JSON 배열 | 스키마 유지 + 샘플 축소 |
| skeleton | API 문서 | 구조 뼈대만 보존 |
| llm_summary | 복잡한 텍스트 | LLM 기반 요약 (Ollama/OpenAI) |
| auto | 모든 유형 | 콘텐츠 분석 후 최적 전략 자동 선택 |
| none | — | 압축 없이 원본 전달 |
자동 선택 로직
섹션 제목: “자동 선택 로직”auto 전략(기본값)은 콘텐츠를 분석하여 최적 전략을 선택합니다:
| 콘텐츠 유형 | 선택되는 전략 |
|---|---|
| JSON 딕셔너리 | extract_fields |
| 대형 JSON 배열 | schema_pruning |
| Markdown 문서 | hybrid |
| API 문서 | skeleton |
| 소형 텍스트 (< 임계값) | truncate |
| 기타 대형 텍스트 | selective |
쿼리 인식 예산 배분
섹션 제목: “쿼리 인식 예산 배분”압축 시 에이전트의 현재 쿼리를 인식하여, 관련 섹션에 더 많은 토큰 예산을 할당합니다. 예를 들어, “인증 모듈”에 대해 질문한 상태에서 API 문서를 압축하면, 인증 관련 엔드포인트에 더 많은 공간을 배분합니다.
제로 정보손실: Progressive Delivery
섹션 제목: “제로 정보손실: Progressive Delivery”progressive 전략은 대형 콘텐츠를 정보 손실 없이 전달합니다:
- 첫 응답에서 목차(TOC)와 첫 번째 청크 전달
- 에이전트가 추가 부분을 요청하면 커서 기반으로 다음 청크 전달
- 전체 내용을 순차적으로 확인 가능
폴백 래더
섹션 제목: “폴백 래더”압축 비율 가드레일(기본 65% 보존)을 위반하면 3단계 폴백이 자동 동작합니다:
progressive → hybrid → truncate각 단계에서 가드레일을 충족하면 해당 전략으로 응답합니다.
압축 예산 설정
섹션 제목: “압축 예산 설정”에이전트의 피드백으로 도구별 압축 예산을 자동 조정합니다:
- 에이전트가 정보 손실을 보고하면 → 해당 도구의 보존 비율 상향
- 에이전트가 응답이 너무 길다고 하면 → 보존 비율 하향