CL Yu's picture

CL Yu

clyu

·

AI & ML interests

None yet

Recent Activity

updated a dataset 2 days ago

n-alignment/alphaquanter

published a dataset 2 days ago

n-alignment/alphaquanter

liked a dataset 2 days ago

openbmb/UltraData-SFT-2605

View all activity

Organizations

submitted a paper to Daily Papers 4 months ago

Approximation of Log-Partition Function in Policy Mirror Descent Induces Implicit Regularization for LLM Post-Training

Paper • 2602.05933 • Published Feb 5 • 6

authored 2 papers 9 months ago

WebAgent-R1: Training Web Agents via End-to-End Multi-Turn Reinforcement Learning

Paper • 2505.16421 • Published May 22, 2025 • 19

Think-RM: Enabling Long-Horizon Reasoning in Generative Reward Models

Paper • 2505.16265 • Published May 22, 2025 • 8