Tongzhou Mu

4

Papers

39

Total Citations

Papers (4)

Policy Decorator: Model-Agnostic Online Refinement for Large Policy Model

DrS: Learning Reusable Dense Rewards for Multi-Stage Tasks

When Should We Prefer State-to-Visual DAgger over Visual Reinforcement Learning?

Refactoring Policy for Compositional Generalizability using Self-Supervised Object Proposals

NeurIPS 2020arXiv