Yun Xing

4

Papers

54

Total Citations

Papers (4)

The Curse of Multi-Modalities: Evaluating Hallucinations of Large Multimodal Models across Language, Visual, and Audio

HENet: Hybrid Encoding for End-to-end Multi-task 3D Perception from Multi-view Cameras

SceneTAP: Scene-Coherent Typographic Adversarial Planner against Vision-Language Models in Real-World Environments

Cross-Domain Few-Shot Segmentation via Iterative Support-Query Correspondence Mining