Yunhang Shen

20

Papers

2,136

Total Citations

10

h-index

Papers (20)

MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models

Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-modal LLMs in Video Analysis

Weakly Supervised Open-Vocabulary Object Detection

SPD-DDPM: Denoising Diffusion Probabilistic Models in the Symmetric Positive Definite Space

Feature Denoising Diffusion Model for Blind Image Quality Assessment

FlashSloth : Lightning Multimodal Large Language Models via Embedded Visual Compression

Dynamic Contrastive Knowledge Distillation for Efficient Image Restoration

From Objects to Events: Unlocking Complex Visual Understanding in Object Detectors via LLM-guided Symbolic Reasoning

Few-Shot Image Quality Assessment via Adaptation of Vision-Language Models

BUFF: Bayesian Uncertainty Guided Diffusion Probabilistic Model for Single Image Super-Resolution

Adaptive Feature Selection for No-Reference Image Quality Assessment by Mitigating Semantic Noise Sensitivity

Weakly Supervised Semantic Segmentation via Progressive Confidence Region Expansion

Learning Interleaved Image-Text Comprehension in Vision-Language Large Models

Probability-Density-aware Semi-supervised Learning

Semi-supervised Blind Image Quality Assessment through Knowledge Distillation and Incremental Learning

Solving the Catastrophic Forgetting Problem in Generalized Category Discovery

A General and Efficient Training for Transformer via Token Expansion

Aligning and Prompting Everything All at Once for Universal Visual Perception

DS-VLM: Diffusion Supervision Vision Language Model

Integrating Global Context Contrast and Local Sensitivity for Blind Image Quality Assessment