Yazhe Niu

4

papers

27

total citations

papers (4)

A Perspective of Q-value Estimation on Offline-to-Online Reinforcement Learning

Hierachical Balance Packing: Towards Efficient Supervised Fine-tuning for Long-Context LLM

Pretrained Reversible Generation as Unsupervised Visual Representation Learning

LightZero: A Unified Benchmark for Monte Carlo Tree Search in General Sequential Decision Scenarios

NeurIPS 2023arXiv