LLM | Believe I.Y.

Apr 13, 2025	Deepseek-R1 모델
Apr 13, 2025	학습할때 메모리가 터진다고? Cut Your Losses!
Apr 12, 2025	GRPO 대신 DAPO: RL 최적화로 LLM 추론 능력 끌어올리기
Feb 23, 2025	DeepSeek-V3 기술 요약
Jan 30, 2025	DeepSeek-R1, o1 을 이기는 중국의 reasoning 모델
Jan 24, 2025	KV-Cache 에 대해 알아보자
Jan 15, 2025	BGE 임베딩 학습 방법 탐방해보기
Jan 14, 2025	임베딩도 더 좋은 데이터가 필요하다, KaLM-Embedding
Jan 12, 2025	kaggle 의 multilingual-chatbot-arena 대회
Jan 11, 2025	LLM 기반 Dense Retrieval 을 위한 학습방법, LLaRA
Jan 10, 2025	간단한 방법으로 AI 모델 속이기, BoN Jail-breaking
Jan 10, 2025	Microsoft 에서 만든 Multi-Agent framework, AutoGen
Jan 09, 2025	Google 의 agent 프레임워크, langfun
Jan 09, 2025	Meta 에서 만든 Agent 벤치마크, GAIA
Jan 07, 2025	FC 보다는 Code 실행이 더 좋은 Agent 를 만든다
Jan 07, 2025	Multi-Agent 관련 리소스 모음
Jan 07, 2025	LLM 이 json 응답을 잘 하도록 하는법
Jan 04, 2025	Don't do RAG
Jan 01, 2025	새로운 Bert 모델: ModernBERT
Dec 30, 2024	SFT 데이터셋의 노이즈를 줄여보자