Zzong's Notes

❯

papers

12개의 글

_archive
advertisement
bandit
bias_fairness
collaborative_filtering
deep_learning
e-commerce
evaluation
language_model
recommender_system
rl
Revisiting Reinforcement Learning for LLM Reasoning from A Cross-Domain Perspective
- LLM
- paper_review