Ming Yan

10

Papers

784

Total Citations

Papers (10)

mPLUG-Owl2: Revolutionizing Multi-modal Large Language Model with Modality Collaboration

Hallucination Augmented Contrastive Learning for Multimodal Large Language Model

WritingBench: A Comprehensive Benchmark for Generative Writing

NeurIPS 2025arXiv

RELI11D: A Comprehensive Multimodal Human Motion Dataset and Method

SymDPO: Boosting In-Context Learning of Large Multimodal Models with Symbol Demonstration Direct Preference Optimization

TiMix: Text-Aware Image Mixing for Effective Vision-Language Pre-training

AdaMMS: Model Merging for Heterogeneous Multimodal Large Language Models with Unsupervised Coefficient Optimization

DiDA: Disambiguated Domain Alignment for Cross-Domain Retrieval with Partial Labels

RoDA: Robust Domain Alignment for Cross-Domain Retrieval Against Label Noise

ClimbingCap: Multi-Modal Dataset and Method for Rock Climbing in World Coordinate