Bo An

33

Papers

197

Total Citations

Papers (33)

Synapse: Trajectory-as-Exemplar Prompting with Memory for Computer Control

Cradle: Empowering Foundation Agents towards General Computer Control

EarnHFT: Efficient Hierarchical Reinforcement Learning for High Frequency Trading

Representation Surgery in Model Merging with Probabilistic Modeling

OpticalNet: An Optical Imaging Dataset and Benchmark Beyond the Diffraction Limit

Improving Unsupervised Hierarchical Representation with Reinforcement Learning

Resisting Stochastic Risks in Diffusion Planners with the Trajectory Aggregation Tree

Safe and Robust Subgame Exploitation in Imperfect Information Games

Configurable Mirror Descent: Towards a Unification of Decision Making

Latent Logic Tree Extraction for Event Sequence Explanation from LLMs

DAG-Based Column Generation for Adversarial Team Games

Combating Noisy Labels by Agreement: A Joint Training Method with Co-Regularization

DO-GAN: A Double Oracle Framework for Generative Adversarial Networks

Empirical Study on Robustness and Resilience in Cooperative Multi-Agent Reinforcement Learning

Influence-Based Fair Selection for Sample-Discriminative Backdoor Attack

Market-GAN: Adding Control to Financial Market Data Generation with Semantic Context

Transition-Informed Reinforcement Learning for Large-Scale Stackelberg Mean-Field Games

Manipulating a Learning Defender and Ways to Counteract

Provably Consistent Partial-Label Learning

Open-set Label Noise Can Improve Robustness Against Inherent Label Noise

RMIX: Learning Risk-Sensitive Policies for Cooperative Reinforcement Learning Agents

Generalizing Consistent Multi-Class Classification with Rejection to be Compatible with Arbitrary Losses

Out-of-Distribution Detection with An Adaptive Likelihood Ratio on Informative Hierarchical VAE

Alleviating "Posterior Collapse'' in Deep Topic Models via Policy Gradient

Deep Attentive Belief Propagation: Integrating Reasoning and Learning for Solving Constraint Optimization Problems

Few-shot Generation via Recalling Brain-Inspired Episodic-Semantic Memory

Computing Optimal Nash Equilibria in Multiplayer Games

On the Importance of Feature Separability in Predicting Out-Of-Distribution Error

State Regularized Policy Optimization on Data with Dynamics Shift

In Defense of Softmax Parametrization for Calibrated and Consistent Learning to Defer

Regression with Cost-based Rejection

TradeMaster: A Holistic Quantitative Trading Platform Empowered by Reinforcement Learning

Offline RL with Discrete Proxy Representations for Generalizability in POMDPs