Zzong's Notes

Home

❯

Retrieval

❯

indexing

❯

Approximate Nearest Neighbor

Approximate Nearest Neighbor

2026년 6월 14일1 min read

Approximate Nearest Neighbor

We can split ANN algorithms into three distinct categories; trees, hashes, and graphs. HNSW slots into the graph category.

B) Github Repos

  • N2
  • GitHub - milvus-io/milvus: Vector database for scalable similarity search and AI applications.
  • GitHub - criteo/autofaiss: Automatically create Faiss knn indices with the most optimal similarity search parameters.

링크된 언급

3
faiss

Faiss 페북 (현 메타) 에서 만든 ANN 라이브러리. ColBERT 논문에서 빠른 retrieval 을 위해 faiss IVFPQ 버전을 사용했다고 한다. 네이버에서는 4ms 도 느리다고 판단하고, 보다 빠른 검색을 위해 Hnswlib 을 사용하는 것 같다. B) Faiss의 핵심 동작 원리: IVF, PQ Indexing IVF (Inverted File Index): 검색 공간을 줄...

HNSW

...le Small World (HNSW) graphs are among the top performing indexes for vector similarity search (Approximate Nearest Neighbor). HNSW는 현재 가장 널리 쓰이는 ANN 알고리즘 중 하나로, 그래프 기반 알고리즘입니다. 동작 원리 (고속도로와 국도 비유): 계층적 그래프 생성: 데이터를 여러 개...

scann

(1) Scann 구글에서 만든 ANN 라이브러리. 2022 년 기준 벤치마크 상으로 가장 좋은 성능을 내고 있다. B) (2) 튜닝하기 데이터가 100k 개 이상일 경우, AH 로 점수를 계산하고 rescore 절차를 거쳐야 한다. AH 로 점수를 계산할 때, dimensions per block 은 2 로 설정하자. 파티셔닝 시에 num leaves 는 데이터포인트 개수의 제곱근 수 (s...

  • Approximate Nearest Neighbor
  • B) Github Repos