Jiantao Jiao

3

Papers

95

Total Citations

Papers (3)

How to Evaluate Reward Models for RLHF

Token Assorted: Mixing Latent and Text Tokens for Improved Language Model Reasoning

Iterative Data Smoothing: Mitigating Reward Overfitting and Overoptimization in RLHF