Jianfeng Wang

7

Papers

100

Total Citations

Papers (7)

MM-Narrator: Narrating Long-form Videos with Multimodal In-Context Learning

MMWorld: Towards Multi-discipline Multi-faceted World Model Evaluation in Videos

SlowFast-VGen: Slow-Fast Learning for Action-Driven Long Video Generation

MM-Vet: Evaluating Large Multimodal Models for Integrated Capabilities

MMSum: A Dataset for Multimodal Summarization and Thumbnail Generation of Videos

LiVOS: Light Video Object Segmentation with Gated Linear Matching

Segment and Caption Anything