Aleksandra Faust

5

Papers

369

Total Citations

Papers (5)

Training Language Models to Self-Correct via Reinforcement Learning

Inference-Aware Fine-Tuning for Best-of-N Sampling in Large Language Models

ElasticTok: Adaptive Tokenization for Image and Video

Stop Regressing: Training Value Functions via Classification for Scalable Deep RL

Position: Levels of AGI for Operationalizing Progress on the Path to AGI