Paul Weng

5

Papers

3

Total Citations

Papers (5)

Reinforcement Learning from Imperfect Corrective Actions and Proxy Rewards

Time Reversal Symmetry for Efficient Robotic Manipulations in Deep Reinforcement Learning

NeurIPS 2025arXiv

Enhancing Online Reinforcement Learning with Meta-Learned Objective from Offline Data

DUO: Diverse, Uncertain, On-Policy Query Generation and Selection for Reinforcement Learning from Human Feedback

INViT: A Generalizable Routing Problem Solver with Invariant Nested View Transformer