Kenneth Li

6

Papers

187

Total Citations

Papers (6)

VITA-1.5: Towards GPT-4o Level Real-Time Vision and Speech Interaction

NeurIPS 2025arXiv

Towards Multimodal Sentiment Analysis Debiasing via Bias Purification

VITA-Audio: Fast Interleaved Audio-Text Token Generation for Efficient Large Speech-Language Model

Incentivizing Reasoning for Advanced Instruction-Following of Large Language Models

NeurIPS 2025arXiv

Zooming from Context to Cue: Hierarchical Preference Optimization for Multi-Image MLLMs

NeurIPS 2025arXiv

Augmenting Biological Fitness Prediction Benchmarks with Landscapes Features from GraphFLA

NeurIPS 2025arXiv