Yongqin Xian

6

Papers

51

Total Citations

Papers (6)

PALM: Predicting Actions through Language Models

Omnia de EgoTempo: Benchmarking Temporal Understanding of Multi-Modal LLMs in Egocentric Videos

Active Data Curation Effectively Distills Large-Scale Multimodal Models

UIP2P: Unsupervised Instruction-based Image Editing via Edit Reversibility Constraint

LOGICZSL: Exploring Logic-induced Representation for Compositional Zero-shot Learning

MOBIUS: Big-to-Mobile Universal Instance Segmentation via Multi-modal Bottleneck Fusion and Calibrated Decoder Pruning