Weiming Ren

4

Papers

97

Total Citations

Papers (4)

OmniEdit: Building Image Editing Generalist Models Through Specialist Supervision

VISTA: Enhancing Long-Duration and High-Resolution Video Understanding by Video Spatiotemporal Augmentation

Vamba: Understanding Hour-Long Videos with Hybrid Mamba-Transformers

MMMU: A Massive Multi-discipline Multimodal Understanding and Reasoning Benchmark for Expert AGI