Kianté Brantley

5

Papers

31

Total Citations

Papers (5)

Regressing the Relative Future: Efficient Policy Optimization for Multi-turn RLHF

$Q\sharp$: Provably Optimal Distributional RL for LLM Post-Training

NeurIPS 2025arXiv

Value-Guided Search for Efficient Chain-of-Thought Reasoning

Coactive Learning for Large Language Models using Implicit User Feedback

When is Transfer Learning Possible?