Yu Liu

45

Papers

594

Total Citations

Papers (45)

VACE: All-in-One Video Creation and Editing

Ranni: Taming Text-to-Image Diffusion for Accurate Instruction Following

Space Group Constrained Crystal Generation

Universal Actions for Enhanced Embodied Foundation Models

SmartRefine: A Scenario-Adaptive Refinement Framework for Efficient Motion Prediction

Rethinking the Spatial Inconsistency in Classifier-Free Diffusion Guidance

A Perspective of Q-value Estimation on Offline-to-Online Reinforcement Learning

Fast Context-Based Low-Light Image Enhancement via Neural Implicit Representations

Learning Disentangled Identifiers for Action-Customized Text-to-Image Generation

Lipschitz Singularities in Diffusion Models

Improved Video VAE for Latent Video Diffusion Model

Decompositional Neural Scene Reconstruction with Generative Diffusion Prior

Novel Class Discovery for Ultra-Fine-Grained Visual Categorization

TACO: Taming Diffusion for in-the-wild Video Amodal Completion

Elegantly Written: Disentangling Writer and Character Styles for Enhancing Online Chinese Handwriting

IDEA-Bench: How Far are Generative Models from Professional Designing?

BACON: Improving Clarity of Image Captions via Bag-of-Concept Graphs

See Further When Clear: Curriculum Consistency Model

NTR-Gaussian: Nighttime Dynamic Thermal Reconstruction with 4D Gaussian Splatting Based on Thermodynamics

AUC Optimization from Multiple Unlabeled Datasets

Effect Size Estimation for Duration Recommendation in Online Experiments: Leveraging Hierarchical Models and Objective Utility Approaches

CI-STHPAN: Pre-trained Attention Network for Stock Selection with Channel-Independent Spatio-Temporal Hypergraph

Critic-Guided Decision Transformer for Offline Reinforcement Learning

GMP-AR: Granularity Message Passing and Adaptive Reconciliation for Temporal Hierarchy Forecasting

Causality-Inspired Invariant Representation Learning for Text-Based Person Retrieval

Pretrained Reversible Generation as Unsupervised Visual Representation Learning

Check Locate Rectify: A Training-Free Layout Calibration System for Text-to-Image Generation

AnyDoor: Zero-shot Object-level Image Customization

ICE-Bench: A Unified and Comprehensive Benchmark for Image Creating and Editing

GLID: Pre-training a Generalist Encoder-Decoder Vision Model

EasyDrag: Efficient Point-based Manipulation on Diffusion Models

LMDrive: Closed-Loop End-to-End Driving with Large Language Models

CPGA: Coding Priors-Guided Aggregation Network for Compressed Video Quality Enhancement

Is Meta-Learning Out? Rethinking Unsupervised Few-Shot Classification with Limited Entropy

DiffDoctor: Diagnosing Image Diffusion Models Before Treating

DreamVideo: Composing Your Dream Videos with Customized Subject and Motion

MangaNinja: Line Art Colorization with Precise Reference Following

MOVIS: Enhancing Multi-Object Novel View Synthesis for Indoor Scenes

StrokeNUWA—Tokenizing Strokes for Vector Graphic Synthesis

CCM: Real-Time Controllable Visual Content Creation Using Text-to-Image Consistency Models

UniFuse: A Unified All-in-One Framework for Multi-Modal Medical Image Fusion Under Diverse Degradations and Misalignments

DecisionNCE: Embodied Multimodal Representations via Implicit Preference Learning

LoD-Loc v2: Aerial Visual Localization over Low Level-of-Detail City Models using Explicit Silhouette Alignment

Improving Pointing Accuracy for 3D Target Selection in Virtual Reality through Depth Perception Biases Correction

As Pseudo-Label Free as Possible: Leveraging Adaptive Feature Generation for Sparsely Annotated Object Detection