🧬Generative Models

Diffusion Models

Score-based and denoising diffusion probabilistic models for generation

100 papers13,343 total citations

Compare with other topics

Feb '24 — Jan '262502 papers

Top Conferences

ICLR: 42 CVPR: 30 ECCV: 17 AAAI: 6 ICML: 2 NeurIPS: 2

Top Papers

#1

MVDream: Multi-view Diffusion for 3D Generation

Yichun Shi, Peng Wang, Jianglong Ye et al.

One-step Diffusion with Distribution Matching Distillation

Tianwei Yin, Michaël Gharbi, Richard Zhang et al.

SiT: Exploring Flow and Diffusion-based Generative Models with Scalable Interpolant Transformers

Nanye Ma, Mark Goldstein, Michael Albergo et al.

Universal Guidance for Diffusion Models

Arpit Bansal, Hong-Min Chu, Avi Schwarzschild et al.

Human Motion Diffusion as a Generative Prior

Yonatan Shafir, Guy Tevet, Roy Kapon et al.

Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion

Dongjun Kim, Chieh-Hsin Lai, WeiHsiang Liao et al.

MagicAnimate: Temporally Consistent Human Image Animation using Diffusion Model

Zhongcong Xu, Jianfeng Zhang, Jun Hao Liew et al.

SV3D: Novel Multi-view Synthesis and 3D Generation from a Single Image using Latent Video Diffusion

Vikram Voleti, Chun-Han Yao, Mark Boss et al.

DragDiffusion: Harnessing Diffusion Models for Interactive Point-based Image Editing

Yujun Shi, Chuhui Xue, Jun Hao Liew et al.

Directly Fine-Tuning Diffusion Models on Differentiable Rewards

Kevin Clark, Paul Vicol, Kevin Swersky et al.

Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model

Chunting Zhou, Lili Yu, Arun Babu et al.

DeepCache: Accelerating Diffusion Models for Free

Xinyin Ma, Gongfan Fang, Xinchao Wang

Photorealistic Video Generation with Diffusion Models

Agrim Gupta, Lijun Yu, Kihyuk Sohn et al.

GaussianDreamer: Fast Generation from Text to 3D Gaussians by Bridging 2D and 3D Diffusion Models

Taoran Yi, Jiemin Fang, Junjie Wang et al.

Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization

Tao Yang, Rongyuan Wu, Peiran Ren et al.

DMV3D: Denoising Multi-view Diffusion Using 3D Large Reconstruction Model

Yinghao Xu, Hao Tan, Fujun Luan et al.

SEINE: Short-to-Long Video Diffusion Model for Generative Transition and Prediction

Xinyuan Chen, Yaohui Wang, Lingjun Zhang et al.

A Variational Perspective on Solving Inverse Problems with Diffusion Models

Morteza Mardani, Jiaming Song, Jan Kautz et al.

Mixed-Type Tabular Data Synthesis with Score-based Diffusion in Latent Space

Hengrui Zhang, Jiani Zhang, Zhengyuan Shen et al.

4D-fy: Text-to-4D Generation Using Hybrid Score Distillation Sampling

Sherwin Bahmani, Ivan Skorokhodov, Victor Rong et al.

BrushNet: A Plug-and-Play Image Inpainting Model with Decomposed Dual-Branch Diffusion

Xuan JU, Xian Liu, Xintao Wang et al.

ECCV 2024arXiv:2403.06976

image inpaintingdiffusion modelsdual-branch architectureplug-and-play model+3

163

citations

#22

Ring-A-Bell! How Reliable are Concept Removal Methods For Diffusion Models?

Yu-Lin Tsai, Chia-Yi Hsu, Chulin Xie et al.

Reconstruction vs. Generation: Taming Optimization Dilemma in Latent Diffusion Models

Jingfeng Yao, Bin Yang, Xinggang Wang

Diffusion Models Are Real-Time Game Engines

Dani Valevski, Yaniv Leviathan, Moab Arar et al.

SweetDreamer: Aligning Geometric Priors in 2D diffusion for Consistent Text-to-3D

Weiyu LI, Rui Chen, Xuelin Chen et al.

MMA-Diffusion: MultiModal Attack on Diffusion Models

Yijun Yang, Ruiyuan Gao, Xiaosen Wang et al.

ResDiff: Combining CNN and Diffusion Model for Image Super-resolution

Shuyao Shang, Zhengyang Shan, Guangxing Liu et al.

AAAI 2024arXiv:2303.08714

image super-resolutiondiffusion probabilistic modelresidual learningfrequency-domain loss+3

139

citations

#28

Scaling Diffusion Language Models via Adaptation from Autoregressive Models

Shansan Gong, Shivam Agarwal, Yizhe Zhang et al.

Lotus: Diffusion-based Visual Foundation Model for High-quality Dense Prediction

Jing He, Haodong Li, Wei Yin et al.

From Slow Bidirectional to Fast Autoregressive Video Diffusion Models

Tianwei Yin, Qiang Zhang, Richard Zhang et al.

MotionLCM: Real-time Controllable Motion Generation via Latent Consistency Model

Wenxun Dai, Ling-Hao Chen, Jingbo Wang et al.

Decomposed Diffusion Sampler for Accelerating Large-Scale Inverse Problems

Hyungjin Chung, Suhyeon Lee, Jong Chul YE

Adjoint Matching: Fine-tuning Flow and Diffusion Generative Models with Memoryless Stochastic Optimal Control

Carles Domingo i Enrich, Michal Drozdzal, Brian Karrer et al.

ICLR 2025arXiv:2409.08861

flow matchingdiffusion modelsstochastic optimal controlreward fine-tuning+3

116

citations

#34

One-dimensional Adapter to Rule Them All: Concepts Diffusion Models and Erasing Applications

Mengyao Lyu, Yuhong Yang, Haiwen Hong et al.

ScaleCrafter: Tuning-free Higher-Resolution Visual Generation with Diffusion Models

Yingqing He, Shaoshu Yang, Haoxin Chen et al.

Seeing and Hearing: Open-domain Visual-Audio Generation with Diffusion Latent Aligners

Yazhou Xing, Yingqing He, Zeyue Tian et al.

Paint3D: Paint Anything 3D with Lighting-Less Texture Diffusion Models

Xianfang Zeng, Xin Chen, Zhongqi Qi et al.

Unpaired Image-to-Image Translation via Neural Schrödinger Bridge

Beomsu Kim, Gihyun Kwon, Kwanyoung Kim et al.

SimDA: Simple Diffusion Adapter for Efficient Video Generation

Zhen Xing, Qi Dai, Han Hu et al.

A General Framework for Inference-time Scaling and Steering of Diffusion Models

Raghav Singhal, Zachary Horvitz, Ryan Teehan et al.

Masked Diffusion Models are Secretly Time-Agnostic Masked Models and Exploit Inaccurate Categorical Sampling

Kaiwen Zheng, Yongxin Chen, Hanzi Mao et al.

DiffusionDepth: Diffusion Denoising Approach for Monocular Depth Estimation

Yiqun Duan, Xianda Guo, Zheng Zhu

Semantic Image Inversion and Editing using Rectified Stochastic Differential Equations

Litu Rout, Yujia Chen, Nataniel Ruiz et al.

LightenDiffusion: Unsupervised Low-Light Image Enhancement with Latent-Retinex Diffusion Models

Hai Jiang, Ao Luo, Xiaohong Liu et al.

Self-correcting LLM-controlled Diffusion Models

Tsung-Han Wu, Long Lian, Joseph Gonzalez et al.

Noise-free Score Distillation

Oren Katzir, Or Patashnik, Daniel Cohen-Or et al.

STAG4D: Spatial-Temporal Anchored Generative 4D Gaussians

Yifei Zeng, Yanqin Jiang, Siyu Zhu et al.

Copilot4D: Learning Unsupervised World Models for Autonomous Driving via Discrete Diffusion

Lunjun Zhang, Yuwen Xiong, Ze Yang et al.

Deconstructing Denoising Diffusion Models for Self-Supervised Learning

Xinlei Chen, Zhuang Liu, Saining Xie et al.

Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency

Jianwen Jiang, Chao Liang, Jiaqi Yang et al.

DiffEditor: Boosting Accuracy and Flexibility on Diffusion-based Image Editing

Chong Mou, Xintao Wang, Jiechong Song et al.

Improved sampling via learned diffusions

Lorenz Richter, Julius Berner

DiffuseMix: Label-Preserving Data Augmentation with Diffusion Models

Khawar Islam, Muhammad Zaigham Zaheer, Arif Mahmood et al.

Detecting, Explaining, and Mitigating Memorization in Diffusion Models

Yuxin Wen, Yuchen Liu, Chen Chen et al.

Unlocking Guidance for Discrete State-Space Diffusion and Flow Models

Hunter Nisonoff, Junhao Xiong, Stephan Allenspach et al.

Consistency Models Made Easy

Zhengyang Geng, Ashwini Pokle, Weijian Luo et al.

InitNO: Boosting Text-to-Image Diffusion Models via Initial Noise Optimization

Xiefan Guo, Jinlin Liu, Miaomiao Cui et al.

Teaching Large Language Models to Regress Accurate Image Quality Scores Using Score Distribution

Zhiyuan You, Xin Cai, Jinjin Gu et al.

DiffusionEdge: Diffusion Probabilistic Model for Crisp Edge Detection

Yunfan Ye, Yuhang Huang, Renjiao Yi et al.

AAAI 2024arXiv:2401.02032

diffusion probabilistic modeledge detectionlatent space denoisingcrisp edge prediction+4

79

citations

#60

Stable Virtual Camera: Generative View Synthesis with Diffusion Models

Jensen Zhou, Hang Gao, Vikram Voleti et al.

DreamTime: An Improved Optimization Strategy for Diffusion-Guided 3D Generation

Yukun Huang, Jianan Wang, Yukai Shi et al.

CCEdit: Creative and Controllable Video Editing via Diffusion Models

Ruoyu Feng, Wenming Weng, Yanhui Wang et al.

LLM-grounded Video Diffusion Models

Long Lian, Baifeng Shi, Adam Yala et al.

LN3Diff: Scalable Latent Neural Fields Diffusion for Speedy 3D Generation

Yushi Lan, Fangzhou Hong, Shuai Yang et al.

Distilling Diffusion Models into Conditional GANs

Minguk Kang, Richard Zhang, Connelly Barnes et al.

BAD-Gaussians: Bundle Adjusted Deblur Gaussian Splatting

Lingzhe Zhao, Peng Wang, Peidong Liu

ECCV 2024arXiv:2403.11831

3d gaussian splattingmotion deblurringneural renderingbundle adjustment+4

74

citations

#67

FontDiffuser: One-Shot Font Generation via Denoising Diffusion with Multi-Scale Content Aggregation and Style Contrastive Learning

Zhenhua Yang, Dezhi Peng, Yuxin Kong et al.

AAAI 2024arXiv:2312.12142

font generationdenoising diffusion modelsmulti-scale content aggregationstyle contrastive learning+4

74

citations

#68

Beyond Autoregression: Discrete Diffusion for Complex Reasoning and Planning

Jiacheng Ye, Jiahui Gao, Shansan Gong et al.

Elucidating the Exposure Bias in Diffusion Models

Mang Ning, Mingxiao Li, Jianlin Su et al.

Improving Diffusion Models for Authentic Virtual Try-on in the Wild

Choi Yisol, Sangkyung Kwak, Kyungmin Lee et al.

ConsistNet: Enforcing 3D Consistency for Multi-view Images Diffusion

Jiayu Yang, Ziang Cheng, Yunfei Duan et al.

Large-scale Reinforcement Learning for Diffusion Models

Yinan Zhang, Eric Tzeng, Yilun Du et al.

EfficientDM: Efficient Quantization-Aware Fine-Tuning of Low-Bit Diffusion Models

YEFEI HE, Jing Liu, Weijia Wu et al.

Plug-In Diffusion Model for Sequential Recommendation

Haokai Ma, Ruobing Xie, Lei Meng et al.

AAAI 2024arXiv:2401.02913

diffusion modelssequential recommendationuser preference modelingdata sparsity+4

69

citations

#75

Optimizing Diffusion Noise Can Serve As Universal Motion Priors

Korrawe Karunratanakul, Konpat Preechakul, Emre Aksan et al.

DiffMorpher: Unleashing the Capability of Diffusion Models for Image Morphing

Kaiwen Zhang, Yifan Zhou, Xudong XU et al.

History-Guided Video Diffusion

Kiwhan Song, Boyuan Chen, Max Simchowitz et al.

DiffusionTrack: Diffusion Model for Multi-Object Tracking

Run Luo, Zikai Song, Lintao Ma et al.

AAAI 2024arXiv:2308.09905

multi-object trackingdenoising diffusion processtracking-by-detectionjoint detection and tracking+3

65

citations

#79

Multi-Source Diffusion Models for Simultaneous Music Generation and Separation

Giorgio Mariani, Irene Tallini, Emilian Postolache et al.

SkillDiffuser: Interpretable Hierarchical Planning via Skill Abstractions in Diffusion-Based Task Execution

Zhixuan Liang, Yao Mu, Hengbo Ma et al.

dKV-Cache: The Cache for Diffusion Language Models

Xinyin Ma, Runpeng Yu, Gongfan Fang et al.

Monte Carlo guided Denoising Diffusion models for Bayesian linear inverse problems.

Gabriel Cardoso, Yazid Janati el idrissi, Sylvain Le Corff et al.

Video Interpolation with Diffusion Models

Siddhant Jain, Daniel Watson, Aleksander Holynski et al.

DiffSHEG: A Diffusion-Based Approach for Real-Time Speech-driven Holistic 3D Expression and Gesture Generation

Junming Chen, Yunfei Liu, Jianan Wang et al.

Accelerating Diffusion Transformers with Token-wise Feature Caching

Chang Zou, Xuyang Liu, Ting Liu et al.

Boosting Consistency in Story Visualization with Rich-Contextual Conditional Diffusion Models

Fei Shen, Hu Ye, Sibo Liu et al.

Simple Guidance Mechanisms for Discrete Diffusion Models

Yair Schiff, Subham Sahoo, Hao Phung et al.

ICLR 2025arXiv:2412.10193

discrete diffusion modelsclassifier-free guidanceuniform noise diffusioncontrollable generation+4

62

citations

#88

PEEKABOO: Interactive Video Generation via Masked-Diffusion

Yash Jain, Anshul Nasery, Vibhav Vineet et al.

Toward effective protection against diffusion-based mimicry through score distillation

Haotian Xue, Chumeng Liang, Xiaoyu Wu et al.

DIFIX3D+: Improving 3D Reconstructions with Single-Step Diffusion Models

Jay Zhangjie Wu, Yuxuan Zhang, Haithem Turki et al.

The Blessing of Randomness: SDE Beats ODE in General Diffusion-based Image Editing

Shen Nie, Hanzhong Guo, Cheng Lu et al.

Diffusion Models for Open-Vocabulary Segmentation

Laurynas Karazija, Iro Laina, Andrea Vedaldi et al.

ECCV 2024arXiv:2306.09316

open-vocabulary segmentationdiffusion modelsvision-language modellingtext-to-image synthesis+4

59

citations

#93

Point Cloud Pre-training with Diffusion Models

xiao zheng, Xiaoshui Huang, Guofeng Mei et al.

Go-with-the-Flow: Motion-Controllable Video Diffusion Models Using Real-Time Warped Noise

Ryan Burgert, Yuancheng Xu, Wenqi Xian et al.

CVPR 2025arXiv:2501.08331

video diffusion modelsmotion controlnoise warping algorithmoptical flow fields+4

59

citations

#95

Coarse-to-Fine Latent Diffusion for Pose-Guided Person Image Synthesis

Yanzuo Lu, Manlin Zhang, Jinhua Ma et al.

GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection

hang yao, Ming LIU, Zhicun Yin et al.

ECCV 2024arXiv:2406.07487

diffusion modelsunsupervised anomaly detectionanomaly-free reconstructionglobal-local adaptation+4

57

citations

#97

What Matters When Repurposing Diffusion Models for General Dense Perception Tasks?

Guangkai Xu, yongtao ge, Mingyu Liu et al.

ICLR 2025arXiv:2403.06090

diffusion modelsdense perception tasksmonocular depth estimationsurface normal estimation+4

56

citations

#98

ObjectDrop: Bootstrapping Counterfactuals for Photorealistic Object Removal and Insertion

Daniel Winter, Matan Cohen, Shlomi Fruchter et al.

Controlling Space and Time with Diffusion Models

Daniel Watson, Saurabh Saxena, Lala Li et al.

Frame Context Packing and Drift Prevention in Next-Frame-Prediction Video Diffusion Models

Lvmin Zhang, Shengqu Cai, Muyang Li et al.

NeurIPS 2025

55

citations

Diffusion Models

Top Conferences

Related Topics (Generative Models)

Top Papers

MVDream: Multi-view Diffusion for 3D Generation

One-step Diffusion with Distribution Matching Distillation

SiT: Exploring Flow and Diffusion-based Generative Models with Scalable Interpolant Transformers

Universal Guidance for Diffusion Models

Human Motion Diffusion as a Generative Prior

Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion

MagicAnimate: Temporally Consistent Human Image Animation using Diffusion Model

SV3D: Novel Multi-view Synthesis and 3D Generation from a Single Image using Latent Video Diffusion

DragDiffusion: Harnessing Diffusion Models for Interactive Point-based Image Editing

Directly Fine-Tuning Diffusion Models on Differentiable Rewards

Transfusion: Predict the Next Token and Diffuse Images with One Multi-Modal Model

DeepCache: Accelerating Diffusion Models for Free

Photorealistic Video Generation with Diffusion Models

GaussianDreamer: Fast Generation from Text to 3D Gaussians by Bridging 2D and 3D Diffusion Models

Pixel-Aware Stable Diffusion for Realistic Image Super-Resolution and Personalized Stylization

DMV3D: Denoising Multi-view Diffusion Using 3D Large Reconstruction Model

SEINE: Short-to-Long Video Diffusion Model for Generative Transition and Prediction

A Variational Perspective on Solving Inverse Problems with Diffusion Models

Mixed-Type Tabular Data Synthesis with Score-based Diffusion in Latent Space

4D-fy: Text-to-4D Generation Using Hybrid Score Distillation Sampling

BrushNet: A Plug-and-Play Image Inpainting Model with Decomposed Dual-Branch Diffusion

Ring-A-Bell! How Reliable are Concept Removal Methods For Diffusion Models?

Reconstruction vs. Generation: Taming Optimization Dilemma in Latent Diffusion Models

Diffusion Models Are Real-Time Game Engines

SweetDreamer: Aligning Geometric Priors in 2D diffusion for Consistent Text-to-3D

MMA-Diffusion: MultiModal Attack on Diffusion Models

ResDiff: Combining CNN and Diffusion Model for Image Super-resolution

Scaling Diffusion Language Models via Adaptation from Autoregressive Models

Lotus: Diffusion-based Visual Foundation Model for High-quality Dense Prediction

From Slow Bidirectional to Fast Autoregressive Video Diffusion Models

MotionLCM: Real-time Controllable Motion Generation via Latent Consistency Model

Decomposed Diffusion Sampler for Accelerating Large-Scale Inverse Problems

Adjoint Matching: Fine-tuning Flow and Diffusion Generative Models with Memoryless Stochastic Optimal Control

One-dimensional Adapter to Rule Them All: Concepts Diffusion Models and Erasing Applications

ScaleCrafter: Tuning-free Higher-Resolution Visual Generation with Diffusion Models

Seeing and Hearing: Open-domain Visual-Audio Generation with Diffusion Latent Aligners

Paint3D: Paint Anything 3D with Lighting-Less Texture Diffusion Models

Unpaired Image-to-Image Translation via Neural Schrödinger Bridge

SimDA: Simple Diffusion Adapter for Efficient Video Generation

A General Framework for Inference-time Scaling and Steering of Diffusion Models

Masked Diffusion Models are Secretly Time-Agnostic Masked Models and Exploit Inaccurate Categorical Sampling

DiffusionDepth: Diffusion Denoising Approach for Monocular Depth Estimation

Semantic Image Inversion and Editing using Rectified Stochastic Differential Equations

LightenDiffusion: Unsupervised Low-Light Image Enhancement with Latent-Retinex Diffusion Models

Self-correcting LLM-controlled Diffusion Models

Noise-free Score Distillation

STAG4D: Spatial-Temporal Anchored Generative 4D Gaussians

Copilot4D: Learning Unsupervised World Models for Autonomous Driving via Discrete Diffusion

Deconstructing Denoising Diffusion Models for Self-Supervised Learning

Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency

DiffEditor: Boosting Accuracy and Flexibility on Diffusion-based Image Editing

Improved sampling via learned diffusions

DiffuseMix: Label-Preserving Data Augmentation with Diffusion Models

Detecting, Explaining, and Mitigating Memorization in Diffusion Models

Unlocking Guidance for Discrete State-Space Diffusion and Flow Models

Consistency Models Made Easy

InitNO: Boosting Text-to-Image Diffusion Models via Initial Noise Optimization

Teaching Large Language Models to Regress Accurate Image Quality Scores Using Score Distribution

DiffusionEdge: Diffusion Probabilistic Model for Crisp Edge Detection

Stable Virtual Camera: Generative View Synthesis with Diffusion Models

DreamTime: An Improved Optimization Strategy for Diffusion-Guided 3D Generation

CCEdit: Creative and Controllable Video Editing via Diffusion Models

LLM-grounded Video Diffusion Models

LN3Diff: Scalable Latent Neural Fields Diffusion for Speedy 3D Generation

Distilling Diffusion Models into Conditional GANs

BAD-Gaussians: Bundle Adjusted Deblur Gaussian Splatting

FontDiffuser: One-Shot Font Generation via Denoising Diffusion with Multi-Scale Content Aggregation and Style Contrastive Learning

Beyond Autoregression: Discrete Diffusion for Complex Reasoning and Planning

Elucidating the Exposure Bias in Diffusion Models

Improving Diffusion Models for Authentic Virtual Try-on in the Wild

ConsistNet: Enforcing 3D Consistency for Multi-view Images Diffusion

Large-scale Reinforcement Learning for Diffusion Models

EfficientDM: Efficient Quantization-Aware Fine-Tuning of Low-Bit Diffusion Models

Plug-In Diffusion Model for Sequential Recommendation

Optimizing Diffusion Noise Can Serve As Universal Motion Priors

DiffMorpher: Unleashing the Capability of Diffusion Models for Image Morphing