Peter Stone

23

Papers

78

Total Citations

Papers (23)

Longhorn: State Space Models are Amortized Online Learners

Minimum Coverage Sets for Training Robust Ad Hoc Teamwork Agents

Learning Optimal Advantage from Preferences and Mistaking It for Reward

Building Minimal and Reusable Causal State Abstractions for Reinforcement Learning

RLZero: Direct Policy Inference from Language Without In-Domain Supervision

NeurIPS 2025arXiv

Sample Efficient Myopic Exploration Through Multitask Reinforcement Learning with Diverse Tasks

Learning a Fast Mixing Exogenous Block MDP using a Single Trajectory

Coopernaut: End-to-End Driving With Cooperative Perception for Networked Vehicles

Argus: A Compact and Versatile Foundation Model for Vision

ELDEN: Exploration via Local Dependencies

LIBERO: Benchmarking Knowledge Transfer for Lifelong Robot Learning

FAMO: Fast Adaptive Multitask Optimization

On the Analysis of Complex Backup Strategies in Monte Carlo Tree Search

Data-Efficient Policy Evaluation Through Behavior Policy Search

Importance Sampling Policy Evaluation with an Estimated Behavior Policy

An Imitation from Observation Approach to Transfer Learning with Dynamics Mismatch

Firefly Neural Architecture Descent: a General Approach for Growing Neural Networks

Adversarial Intrinsic Motivation for Reinforcement Learning

Conflict-Averse Gradient Descent for Multi-task learning

Machine versus Human Attention in Deep Reinforcement Learning Tasks

Value Function Decomposition for Iterative Design of Reinforcement Learning Agents

BOME! Bilevel Optimization Made Easy: A Simple First-Order Approach

f-Policy Gradients: A General Framework for Goal-Conditioned RL using f-Divergences