Yunhai Tong

9

Papers

91

Total Citations

Papers (9)

Towards Language-Driven Video Inpainting via Multimodal Large Language Models

Explore In-Context Segmentation via Latent Diffusion Models

MTL-LoRA: Low-Rank Adaptation for Multi-Task Learning

DreamRelation: Bridging Customization and Relation Generation

Are They the Same? Exploring Visual Correspondence Shortcomings of Multimodal LLMs

Decouple and Track: Benchmarking and Improving Video Diffusion Transformers For Motion Transfer

Conditional Panoramic Image Generation via Masked Autoregressive Modeling

Towards Scalable and Deep Graph Neural Networks via Noise Masking

DiffSensei: Bridging Multi-Modal LLMs and Diffusion Models for Customized Manga Generation