๐ Jina-Embeddings-v4 ๋ ผ๋ฌธ ์์ฝ
A.1) ๋ชจ๋ธ ๊ฐ์
- ๋ชจ๋ธ ํฌ๊ธฐ: ์ฝ 3.8B ํ๋ผ๋ฏธํฐ
- ๊ธฐ๋ฐ ๋ชจ๋ธ: Qwen2.5-VL-3B-Instruct
- ์ ๋ ฅ ๋ฒ์: ์ต๋ 32k ํ ํฐ์ ํ ์คํธ์ ์ต๋ 20MP ํด์๋์ ์ด๋ฏธ์ง
- ์ถ๋ ฅ ๋ฐฉ์:
- Single-vector ๋ชจ๋: ์ ์ฒด ๋ฌธ์๋ฅผ ํ๋์ 2048์ฐจ์ ๋ฒกํฐ๋ก ํํ. Matryoshka ๋ฐฉ์์ ํตํด 128~512์ฐจ์์ผ๋ก ์ถ์ ๊ฐ๋ฅ.
- Multi-vector ๋ชจ๋: ๊ฐ ํ ํฐ์ ๋ ๋ฆฝ์ ์ธ 128์ฐจ์ ๋ฒกํฐ๋ก ํฌ์ํ์ฌ, ํ ํฐ ์๋งํผ์ ๋ฒกํฐ๋ฅผ ์์ฑ.
A.2) Multi-vector ๋ฐฉ์
์ด ๋ฐฉ์์ ์ ๋ ฅ๋ ๊ฐ ํ ํฐ(ํ ์คํธ๋ ์ด๋ฏธ์ง ๋จ์)์ ๋ ๋ฆฝ์ ์ผ๋ก ์๋ฒ ๋ฉํ์ฌ ColBERT ์คํ์ผ์ late interaction์ ํ์ฉํด ์ฟผ๋ฆฌ์ ๋ฌธ์๋ฅผ ๋งค์นญํ๋ค.
์ฅ์
- ํ, ์ฐจํธ, ์ฝ๋์ ๊ฐ์ ์ธ๋ฐํ ๋จ์์ ๊ฒ์์ ๋ฐ์ด๋จ.
- ์ฟผ๋ฆฌ์ ๋ฌธ์์ ํน์ ๋ถ๋ถ ๊ฐ ์ง์ ์ ์ธ ๋งค์นญ ๊ฐ๋ฅ.
๋จ์
- ๋ฒกํฐ ์๊ฐ ํ ํฐ ์์ ๋น๋กํ๋ฏ๋ก ์ ์ฅ ๊ณต๊ฐ๊ณผ ์ฐ์ฐ๋์ด ํฌ๊ฒ ์ฆ๊ฐ.
๋์ ์ ๋ต
- ์ค์ ํ ํฐ๋ง ์ ํํ์ฌ ์ ์งํ๊ฑฐ๋,
- ๊ธด ๋ฌธ์๋ ์ฌ๋ผ์ด๋ฉ ์๋์ฐ๋ก ๋ถํ ํ์ฌ ์ฒ๋ฆฌ,
- ๋๋ single-vector์ ๋ณํ ์ฌ์ฉ.
A.3) Single-vector ๋ฐฉ์
๋ชจ๋ ํ ํฐ ์๋ฒ ๋ฉ์ ํ๊ท ํ๋ง(mean pooling)ํด ํ๋์ ๊ณ ์ ๋ ๋ฒกํฐ๋ก ํํํ๋ ๊ตฌ์กฐ์ด๋ค.
์ฅ์
- ์ ์ฅ ํจ์จ๊ณผ ๊ฒ์ ์๋๊ฐ ์ฐ์ํจ.
- Matryoshka ์ฐจ์ ์ถ์๋ฅผ ์ ์ฉํด๋ ์ฑ๋ฅ ์ ํ๊ฐ ์ ์.
๋จ์
- ์ธ๋ฐํ ์ ๋ณด(์: ํ ๋ด ํน์ ๊ฐ)์ ๋ํ ๊ฒ์ ์ฑ๋ฅ์ ๋ค์ ๋จ์ด์ง.
A.4) LoRA ์ด๋ํฐ (ํ์คํฌ ๋ง์ถค ์ต์ ํ)
๊ฐ ํ์คํฌ์ ๋ง๊ฒ ํ์ต๋ LoRA ์ด๋ํฐ๋ฅผ ํตํด ์ฑ๋ฅ์ ์ธ๋ถํํ๋ค.
| ์ด๋ํฐ ์ข ๋ฅ | ์ฃผ์ ๋ชฉ์ | ํน์ง |
|---|---|---|
| Retrieve ์ด๋ํฐ | ๋น๋์นญ ์ฟผ๋ฆฌโ๋ฌธ์ ๊ฒ์ | ์ ๋์ฌ ์ธ์ฝ๋ฉ + ํ๋ ๋ค๊ฑฐํฐ๋ธ ํ์ต |
| Text Matching ์ด๋ํฐ | ์๋ฏธ์ ์ ์ฌ๋ ๊ณ์ฐ | CoSENT loss ๊ธฐ๋ฐ ํ์ต |
| Code ์ด๋ํฐ | ์ฝ๋โ์์ฐ์ด ๊ฒ์ | ์ฝ๋ ์ ์ฉ ํํ ์ต์ ํ |
A.5) ์ฃผ์ ์ฑ๋ฅ ์งํ
| ํ๊ฐ ํญ๋ชฉ | ๊ฒฐ๊ณผ ์์ฝ |
|---|---|
| ์๊ฐ ๋ฌธ์ ๊ฒ์ (Jina-VDR) | ๊ธฐ์กด ColPali ๋๋น ๋์ ์ ์ |
| ViDoRe ๋ฒค์น๋งํฌ | multi-vector ๋ชจ๋์์ ํ์คํ ์ฐ์ |
| Cross-modal ๊ฒ์(CLIP ๊ธฐ์ค) | jina-clip-v2 ๋๋น ๊ฐ์ ๋ ์ฑ๋ฅ |
| STS(๋ฌธ์ฅ ์ ์ฌ๋) | ์์ดยท๋ค๊ตญ์ด ๋ชจ๋ ์์ ์ ์ธ ๊ฒฐ๊ณผ |
| ์ฝ๋ ๊ฒ์(CoIR) | ํนํ ๋ชจ๋ธ๋ณด๋ค ๋ฎ์ง๋ง ๋ฒ์ฉ์ฑ ๋๋น ์ฐ์ |
A.6) ํจ์จ์ ํ์ฉ ์ ๋ต
| ์ํฉ | ์ถ์ฒ ๋ชจ๋ |
|---|---|
| ๋๊ท๋ชจ ๋ฐ์ดํฐ, ๋น ๋ฅธ ๊ฒ์ ํ์ ์ | Single-vector (128~512์ฐจ์ ์ถ์ ํ์ฉ) |
| ์ธ๋ฐํ ์ ๋ณด ํ์, ์ ๋ฐ ๋งค์นญ ํ์ ์ | Multi-vector ์ฌ์ฉ (ํนํ ํยท์ฝ๋ยท์ด๋ฏธ์ง ๋ถ์์ ํจ๊ณผ์ ) |
| ์ค์ ์๋น์ค ํ๊ฒฝ | single-vector๋ก coarse filtering ํ multi-vector๋ก ์ ๊ตํ reranking ์ํ |
A.7) โ ํต์ฌ ์์ฝ
Jina-Embeddings-v4๋ ๋ฉํฐ๋ชจ๋ฌ, ๋ค๊ตญ์ด, ์ฅ๋ฌธ ์ฒ๋ฆฌ๋ฅผ ๋ชจ๋ ์ง์ํ๋ ๋ฒ์ฉ ์๋ฒ ๋ฉ ๋ชจ๋ธ์ด๋ค. ํนํ multi-vector ๋ฐฉ์์ ํตํด ์ ๊ตํ ํํ๋ ฅ์ ํ๋ณดํ๋ฉด์๋, single-vector ๋ฐฉ์์ ์ด์ฉํด ํจ์จ์ฑ๊ณผ ์ค์ฉ์ฑ์ ๋์์ ๋ฌ์ฑํ๋ ํ์ด๋ธ๋ฆฌ๋ ์ ๊ทผ๋ฒ์ ์ ์ํ๋ค.