Xiaodong Cun

29

Papers

981

Total Citations

1

Affiliations

Affiliations

Great Bay University

Papers (29)

Follow Your Pose: Pose-Guided Text-to-Video Generation Using Pose-Free Videos

EvalCrafter: Benchmarking and Evaluating Large Video Generation Models

SmartEdit: Exploring Complex Instruction-based Image Editing with Multimodal Large Language Models

ScaleCrafter: Tuning-free Higher-Resolution Visual Generation with Diffusion Models

DEIM: DETR with Improved Matching for Fast Convergence

Make a Cheap Scaling: A Self-Cascade Diffusion Model for Higher-Resolution Adaptation

DiTCtrl: Exploring Attention Control in Multi-Modal Diffusion Transformer for Tuning-Free Multi-Prompt Longer Video Generation

Make-Your-Anchor: A Diffusion-based 2D Avatar Generation Framework

Noise Calibration: Plug-and-play Content-Preserving Video Enhancement using Pre-trained Video Diffusion Models

CodeTalker: Speech-Driven 3D Facial Animation With Discrete Motion Prior

SadTalker: Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking Face Animation

Explicit Visual Prompting for Low-Level Structure Segmentations

LivelySpeaker: Towards Semantic-Aware Co-Speech Gesture Generation

FateZero: Fusing Attentions for Zero-shot Text-based Video Editing

ToonTalker: Cross-Domain Face Reenactment

High-Resolution Document Shadow Removal via A Large-Scale Real-World Dataset and A Frequency-Aware Shadow Erasing Net

Defocus Blur Detection via Depth Distillation

Spatial-Separated Curve Rendering Network for Efficient and High-Resolution Image Harmonization

StyleHEAT: One-Shot High-Resolution Editable Talking Face Generation via Pre-trained StyleGAN

Uformer: A General U-Shaped Transformer for Image Restoration

DepthCrafter: Generating Consistent Long Depth Sequences for Open-world Videos

CustomTTT: Motion and Appearance Customized Video Generation via Test-Time Training

X-Adapter: Adding Universal Compatibility of Plugins for Upgraded Diffusion Model

VideoCrafter2: Overcoming Data Limitations for High-Quality Video Diffusion Models

Depth-aware Test-Time Training for Zero-shot Video Object Segmentation

3D GAN Inversion With Facial Symmetry Prior

Generating Human Motion From Textual Descriptions With Discrete Representations

DPE: Disentanglement of Pose and Expression for General Video Portrait Editing

Inserting Anybody in Diffusion Models via Celeb Basis