하이브리드 검색

memtomem의 하이브리드 검색은 키워드 검색과 시맨틱 검색을 결합하여, 정확한 용어 매칭과 의미 기반 유사도를 동시에 활용합니다.

검색 아키텍처

하이브리드 검색은 세 가지 검색 엔진을 병렬로 실행합니다:

검색 엔진	기반	강점
BM25	SQLite FTS5	정확한 키워드/용어 매칭. “FastAPI”, “mem_search” 같은 고유 명칭에 강함
벡터 검색	sqlite-vec + ONNX/Ollama/OpenAI 임베딩	의미적 유사도. “배포 방법” → “deployment checklist” 매칭 가능
RRF 융합	Reciprocal Rank Fusion	두 검색 결과의 순위를 결합하여 최종 랭킹 산출

인덱싱 시 문서를 의미 단위로 분할합니다. 단순 토큰 수 기반이 아닌, 구조를 인식하는 6종 청킹 전략:

전체 재인덱싱 대신, 변경된 부분만 갱신합니다:

대규모 문서셋에서도 인덱싱 비용을 최소화합니다.

기억을 스코프별로 구분하여 관리합니다: