Xiaohan Ding

4

Papers

11

Total Citations

Papers (4)

Multimodal Pathway: Improve Transformers with Irrelevant Data from Other Modalities

UniRepLKNet: A Universal Perception Large-Kernel ConvNet for Audio Video Point Cloud Time-Series and Image Recognition

Quantized Prompt for Efficient Generalization of Vision-Language Models

Low-Rank Approximation for Sparse Attention in Multi-Modal LLMs