2025

an archive of posts from this year

Apr 13, 2025 Deepseek-R1 모델
Apr 13, 2025 학습할때 메모리가 터진다고? Cut Your Losses!
Apr 12, 2025 GRPO 대신 DAPO: RL 최적화로 LLM 추론 능력 끌어올리기
Feb 23, 2025 DeepSeek-V3 기술 요약
Feb 22, 2025 python accelerate 라이브러리 함수 조사기
Feb 06, 2025 Multi-Head Latent Attention
Feb 03, 2025 ML Recap - Confusion Matrix
Feb 03, 2025 ML Recap - BM25 & TF-IDF
Feb 03, 2025 Airflow & PySpark 개념 정리
Feb 03, 2025 AB Test 개념 정리
Feb 02, 2025 네이버 컨퍼런스 DAN 24 정리
Jan 30, 2025 DeepSeek-R1, o1 을 이기는 중국의 reasoning 모델
Jan 24, 2025 KV-Cache 에 대해 알아보자
Jan 24, 2025 LLM 이용해서 임베딩 모델의 품질 높이기
Jan 21, 2025 RAG 구축 레슨런
Jan 19, 2025 ML Recap - Beta Distribution
Jan 15, 2025 BGE 임베딩 학습 방법 탐방해보기
Jan 15, 2025 ANN 방법론중 하나인 HNSW 알고리즘 정리
Jan 14, 2025 임베딩도 더 좋은 데이터가 필요하다, KaLM-Embedding
Jan 12, 2025 ML Recap - Basic Feature Engineering
Jan 12, 2025 ML Recap - Linear Regression
Jan 12, 2025 kaggle 의 multilingual-chatbot-arena 대회
Jan 12, 2025 Embedding 과 Reranker 은 무슨 차이일까?
Jan 11, 2025 LLM 기반 Dense Retrieval 을 위한 학습방법, LLaRA
Jan 11, 2025 Algorithm lesson learned - string
Jan 10, 2025 간단한 방법으로 AI 모델 속이기, BoN Jail-breaking
Jan 10, 2025 Microsoft 에서 만든 Multi-Agent framework, AutoGen
Jan 09, 2025 Google 의 agent 프레임워크, langfun
Jan 09, 2025 Meta 에서 만든 Agent 벤치마크, GAIA
Jan 07, 2025 FC 보다는 Code 실행이 더 좋은 Agent 를 만든다
Jan 07, 2025 Multi-Agent 관련 리소스 모음
Jan 07, 2025 LLM 이 json 응답을 잘 하도록 하는법
Jan 06, 2025 llama 에 대해서 알아보자
Jan 06, 2025 Algorithm lesson learned - array
Jan 05, 2025 Semantic Retrieval at Walmart
Jan 05, 2025 차원 축소 전략 중 하나인 Linear Discriminant Analysis
Jan 04, 2025 Don't do RAG
Jan 04, 2025 The collection of RAG competitions
Jan 03, 2025 행렬 미분 기초 (with Trace)
Jan 02, 2025 Text Embedding 모델: E5
Jan 01, 2025 새로운 Bert 모델: ModernBERT