Chao Yu

7

Papers

18

Total Citations

Papers (7)

ReinFlow: Fine-tuning Flow Matching Policy with Online Reinforcement Learning

Offline Multi-Agent Reinforcement Learning via In-Sample Sequential Policy Optimization

Conservative Offline Goal-Conditioned Implicit V-Learning

Language Agents with Reinforcement Learning for Strategic Play in the Werewolf Game

Is DPO Superior to PPO for LLM Alignment? A Comprehensive Study

Accelerate Multi-Agent Reinforcement Learning in Zero-Sum Games with Subgame Curriculum Learning

Rapid Learning in Constrained Minimax Games with Negative Momentum