paper-review
an archive of posts in this category
| Apr 13, 2025 | 학습할때 메모리가 터진다고? Cut Your Losses! |
|---|---|
| Apr 12, 2025 | GRPO 대신 DAPO: RL 최적화로 LLM 추론 능력 끌어올리기 |
| Feb 23, 2025 | DeepSeek-V3 기술 요약 |
| Jan 30, 2025 | DeepSeek-R1, o1 을 이기는 중국의 reasoning 모델 |
| Jan 24, 2025 | KV-Cache 에 대해 알아보자 |
| Jan 24, 2025 | LLM 이용해서 임베딩 모델의 품질 높이기 |
| Jan 21, 2025 | RAG 구축 레슨런 |
| Jan 14, 2025 | 임베딩도 더 좋은 데이터가 필요하다, KaLM-Embedding |
| Jan 11, 2025 | LLM 기반 Dense Retrieval 을 위한 학습방법, LLaRA |
| Jan 07, 2025 | FC 보다는 Code 실행이 더 좋은 Agent 를 만든다 |
| Jan 05, 2025 | Semantic Retrieval at Walmart |
| Jan 04, 2025 | Don't do RAG |
| Jan 02, 2025 | Text Embedding 모델: E5 |
| Jan 01, 2025 | 새로운 Bert 모델: ModernBERT |
| Dec 30, 2024 | SFT 데이터셋의 노이즈를 줄여보자 |