Yanfeng Wang

25

Papers

128

Total Citations

Papers (25)

ReMamber: Referring Image Segmentation with Mamba Twister

Audio-Visual Segmentation via Unlabeled Frame Exploitation

Towards Universal Soccer Video Understanding

Multi-Sentence Grounding for Long-term Instructional Video

4DGC: Rate-Aware 4D Gaussian Compression for Efficient Streamable Free-Viewpoint Video

On Harmonizing Implicit Subpopulations

Learning to Instruct for Visual Instruction Tuning

NeurIPS 2025arXiv

Differential-informed Sample Selection Accelerates Multimodal Contrastive Learning

Fine-tuning with Reserved Majority for Noise Reduction

Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images

HarmoDT: Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning

Q-value Regularized Transformer for Offline Reinforcement Learning

Locally Estimated Global Perturbations are Better than Local Perturbations for Federated Sharpness-aware Minimization

Self-Alignment of Large Language Models via Monopolylogue-based Social Scene Simulation

Exploring Training on Heterogeneous Data with Mixture of Low-rank Adapters

LamRA: Large Multimodal Model as Your Advanced Retrieval Assistant

Diversified Batch Selection for Training Acceleration

Advancing Myopia To Holism: Fully Contrastive Language-Image Pre-training

MRGen: Segmentation Data Engine For Underrepresented MRI Modalities

RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis

VRVVC: Variable-Rate NeRF-Based Volumetric Video Compression

Low-Rank Knowledge Decomposition for Medical Foundation Models

Intelligent Grimm - Open-ended Visual Storytelling via Latent Diffusion Models

Editable Scene Simulation for Autonomous Driving via Collaborative LLM-Agents

Mitigating Noisy Correspondence by Geometrical Structure Consistency Learning