멀티 벡터 검색을 빠르게 구현하는 MUVERA라는 개념과 디퓨전을 LLM에 적용한 Mercury 모델이 신기해 보여서 관련된 정보들을 모아보았다. 나중에 기회가 되면 논문과 코드를 자세히 살펴봐야겠다.
멀티벡터 검색:
상품 하나를 ‘외형 벡터’, ‘텍스트 설명 벡터’, ‘사용자 리뷰 벡터’ 등으로 나누어 표현하면, 사용자의 쿼리 의도에 따라 특정 벡터를 선택하거나 조합하여 훨씬 더 정교하고 관련성 높은 검색이 가능하게 하는 개념이라고 한다.
ColBERT가 멀티 벡터 모델 중 하나라고 한다.
ColBERT 논문: 링크
ColBERT Github: 링크
MUVERA:
멀티 벡터 검색을 단일 벡터 검색과 유사하게 빠르게 동작하도록 만드는 알고리즘.
멀티 벡터들을 고정 길이 벡터(FDE, Fixed Dimensional Encoding)로 압축해, 단일 벡터 기반 MIPS(내적 최대 검색)로 초고속 검색 후 재정렬
Mercury:
Transformer 모델이 기반하여 Diffusion을 적용한 LLM
Playground: 링크
References:
https://news.hada.io/topic?id=21739
https://news.hada.io/topic?id=21875
https://research.google/blog/muvera-making-multi-vector-retrieval-as-fast-as-single-vector-search/
'NLP > LLM' 카테고리의 다른 글
| Mamba (2023) 논문 리뷰 (2) | 2025.08.26 |
|---|---|
| 도메인 특화 LLM 리서치 (4) | 2025.08.12 |
| Mixtral (2024) 논문 리뷰 (0) | 2025.06.24 |
| Codex (2021) 논문 리뷰 (1) | 2025.06.24 |
| LLM에서의 temperature, Top-k, Top-p, Penalties (0) | 2025.05.11 |