Zhengrong Yue

4

Papers

18

Total Citations

Papers (4)

VideoChat-R1.5: Visual Test-Time Scaling to Reinforce Multimodal Reasoning by Iterative Perception

NeurIPS 2025arXiv

V-Stylist: Video Stylization via Collaboration and Reflection of MLLM Agents

LVAgent: Long Video Understanding by Multi-Round Dynamical Collaboration of MLLM Agents

Muses: 3D-Controllable Image Generation via Multi-Modal Agent Collaboration