Yan Yan

24

Papers

44

Total Citations

Papers (24)

Token Transformation Matters: Towards Faithful Post-hoc Explanation for Vision Transformer

Efficient Multitask Dense Predictor via Binarization

InfantAgent-Next: A Multimodal Generalist Agent for Automated Computer Interaction

Federated Partial Label Learning with Local-Adaptive Augmentation and Regularization

CaO2: Rectifying Inconsistencies in Diffusion-Based Dataset Distillation

Efficient Multimodal Dataset Distillation via Generative Models

Enhancing Dance-to-Music Generation via Negative Conditioning Latent Diffusion Model

Orientation-anchored Hyper-Gaussian for 4D Reconstruction from Casual Videos

NeurIPS 2025arXiv

ConformalSAM: Unlocking the Potential of Foundational Segmentation Models in Semi-Supervised Semantic Segmentation with Conformal Prediction

High-Order Structure Based Middle-Feature Learning for Visible-Infrared Person Re-identification

Versatile Navigation Under Partial Observability via Value-guided Diffusion Policy

BlockGCN: Redefine Topology Awareness for Skeleton-Based Action Recognition

On the Faithfulness of Vision Transformer Explanations

Enhancing Post-training Quantization Calibration through Contrastive Learning

DKDM: Data-Free Knowledge Distillation for Diffusion Models with Any Architecture

The Pitfalls and Promise of Conformal Inference Under Adversarial Attacks

Distilling Long-tailed Datasets

QuEST: Low-bit Diffusion Model Quantization via Efficient Selective Finetuning

LLaVA-PruMerge: Adaptive Token Reduction for Efficient Large Multimodal Models

MaskSAM: Auto-prompt SAM with Mask Classification for Volumetric Medical Image Segmentation

You Are Your Own Best Teacher: Achieving Centralized-level Performance in Federated Learning under Heterogeneous and Long-tailed Data

Robin3D: Improving 3D Large Language Model via Robust Instruction Tuning

Language Decoupling with Fine-grained Knowledge Guidance for Referring Multi-object Tracking

WaveFormer: Wavelet Transformer for Noise-Robust Video Inpainting