Embedding 과 Reranker 은 무슨 차이일까?


임베딩과 리랭킹 모델은 어떤 차이가 있는지 궁금해서 찾아봤다.

Embedding

임베딩 모델은 말 그대로 text 를 임베딩으로 변환하는 모델이다.

query 와 passage 를 입력으로 받아서, 임베딩 모델은 각 임베딩을 출력하고, 유사도 계산으로 두 임베딩을 활용할 수 있다.

Reranker

리랭킹 모델은 임베딩 모델과 다르게 입력으로 question 과 document 를 입력으로 받아서, 직접적으로 유사도를 계산하는 방식이다. 즉, 임베딩을 생성하지 않고, relevance score 를 계산한다.

score 는 일반적으로 sigmoid 함수를 통해서 [0,1] 사이의 float 값으로 변환된다.

Reference

Reranker




    Enjoy Reading This Article?

    Here are some more articles you might like to read next:

  • Deepseek-R1 모델
  • 학습할때 메모리가 터진다고? Cut Your Losses!
  • GRPO 대신 DAPO: RL 최적화로 LLM 추론 능력 끌어올리기
  • DeepSeek-V3 기술 요약
  • python accelerate 라이브러리 함수 조사기