Zzong's Notes
Search
검색
다크 모드
라이트 모드
탐색기
LLM
40건의 항목
2026년 6월 14일
Batch Decoding
LLM
2026년 6월 14일
Hallucination
LLM
2026년 6월 14일
FastChat
LLM
2026년 6월 14일
polyglot
LLM
korean
NLP
2026년 6월 14일
Prompt Compression
LLM
2026년 6월 14일
RLHF
LLM
reinforcement_learning
2026년 6월 14일
TrainerCallback
huggingface
deep_learning
LLM
2026년 6월 14일
DPO
LLM
2026년 6월 14일
DistributedDataParallel
deep_learning
LLM
2026년 6월 14일
GPT-2
LLM
2026년 6월 14일
GPT
NLP
LLM
2026년 6월 14일
GRPO
reinforcement_learning
LLM
2026년 6월 14일
LVLM 를 따라하는 정보 넣기
LLM
LVLM
2026년 6월 14일
Large Language Model
NLP
LLM
2026년 6월 14일
Llama
LLM
2026년 6월 14일
LoRA
LLM
2026년 6월 14일
Proximal Policy Optimization
reinforcement_learning
LLM
2026년 6월 14일
T5
summarization
LLM
2026년 6월 14일
Train Large Model
LLM
deepspeed
2026년 6월 14일
deepspeed
deep_learning
LLM
2026년 6월 14일
vllm
LLM
2026년 6월 14일
llm_as_classifier
LLM
2026년 6월 14일
vicuna
LLM
2026년 6월 14일
MT-bench
LMSYS
LLM
evaluation
2026년 6월 14일
supervised fine-tuning
deep_learning
LLM
2026년 6월 14일
DeepSpeed-MoE
MoE
deep_learning
LLM
2026년 6월 14일
LLMOps
MLOps
LLM
generative_model
server
inference
pipeline
2026년 6월 14일
Revisiting Reinforcement Learning for LLM Reasoning from A Cross-Domain Perspective
LLM
paper_review
2026년 6월 14일
BEQUE - Large Language Model based Long-tail Query Rewriting in Taobao Search
e-commerce
WWW
paper_review
query_rewriting
LLM
y2024
todo
trans
2026년 6월 14일
Chain of Hindsight Aligns Language Models with Feedback
language_model
LLM
nlp
paper_review
y2023
2026년 6월 14일
Compact Language Models via Pruning andKnowledge Distillation
language_model
distillation
pruning
LLM
nlp
paper_review
sLLM
2026년 6월 14일
DialogLM
language_model
LLM
Microsoft
NLP
nlp
paper_review
summarization
y2022
2026년 6월 14일
LIMA
language_model
LLM
nlp
paper_review
2026년 6월 14일
Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs
LLM
RLVR
paper_review
reinforcement_learning
2026년 6월 14일
A Survey on AI Search with LargeLanguage Models
retrieval
IR
survey
LLM
2026년 6월 14일
LLM2Vec
embedding
dense_retrieval
LLM
2026년 6월 14일
GRAM - Generative Retrieval and Alignment Model
retrieval
e-commerce
generative_retrieval
LLM
paper_review
y2025
JD
2026년 6월 14일
LREF
retrieval
IR
paper_review
LLM
e-commerce
relevance
y2025
2026년 6월 14일
Towards More Relevant Product Search Ranking Via Large Language Models
retrieval
e-commerce
ranking
LLM
learning_to_rank
paper_review
2026년 6월 14일
Yelp - Search Query Understanding with LLMs
retrieval
e-commerce
query_understanding
LLM