Weinan Zhang

27

Papers

365

Total Citations

Papers (27)

Vision-Language Foundation Models as Effective Robot Imitators

ReMA: Learning to Meta-Think for LLMs with Multi-agent Reinforcement Learning

NeurIPS 2025arXiv

Autonomous Goal Detection and Cessation in Reinforcement Learning: A Case Study on Source Term Estimation

Beyond Graph Convolution: Multimodal Recommendation with Topology-aware MLPs

Score-Based Diffusion Policy Compatible with Reinforcement Learning via Optimal Transport

GenPO: Generative Diffusion Models Meet On-Policy Reinforcement Learning

Information-Theoretic Reward Decomposition for Generalizable RLHF

ContraDiff: Planning Towards High Return States via Contrastive Learning

AlphaZero-Like Tree-Search can Guide Large Language Model Decoding and Training

DiffStitch: Boosting Offline Reinforcement Learning with Diffusion-based Trajectory Stitching

Bootstrapped Transformer for Offline Reinforcement Learning

PerfectDou: Dominating DouDizhu with Perfect Information Distillation

Lending Interaction Wings to Recommender Systems with Conversational Agents

Diffusion Model is an Effective Planner and Data Synthesizer for Multi-Task Reinforcement Learning

Path-Level Network Transformation for Efficient Architecture Search

Mean Field Multi-Agent Reinforcement Learning

CoT: Cooperative Training for Generative Modeling of Discrete Data

Lipschitz Generative Adversarial Nets

Model-based Policy Optimization with Unsupervised Model Adaptation

Efficient Projection-free Algorithms for Saddle Point Problems

On Effective Scheduling of Model-based Reinforcement Learning

Curriculum Offline Imitating Learning

Reinforcement Learning with Automated Auxiliary Loss Search

Honor of Kings Arena: an Environment for Generalization in Competitive Reinforcement Learning

Learning Enhanced Representation for Tabular Data via Neighborhood Propagation

Multi-Agent Reinforcement Learning is a Sequence Modeling Problem

NeoRL: A Near Real-World Benchmark for Offline Reinforcement Learning