요즘 RAG 시스템을 구축하면서 검색 정확도를 어떻게 높일 수 있을지 고민해보신 적 있으신가요? 특히 문서를 작은 청크로 나눠 처리할수록 BM25 기반 검색 알고리즘의 한계가 뚜렷하게 드러납니다. 이런 문제를 해결하기 위해 등장한 기술이 바로 "Contextual BM25F"예요. 오늘은 이 기술이 어떤 원리로 작동하는지, 그리고 왜 주목받고 있는지를 쉽게 풀어드릴게요. Contextual BM25F는 기존 방식과 뭐가 다를까요?우선, BM25는 오래전부터 정보 검색 분야에서 많이 쓰인 방식이에요. 간단히 말해, 단어가 문서에 얼마나 자주 등장하는지를 기준으로 점수를 매기는 알고리즘이죠. 여기에 BM25F는 "필드"라는 개념을 도입해서, 문서의 제목, 본문, 요약 등 각 부분마다 가중치를 다르게 줄 수 ..