Aliaksandr Siarohin

29

Papers

663

Total Citations

Papers (29)

Panda-70M: Captioning 70M Videos with Multiple Cross-Modality Teachers

VD3D: Taming Large Video Diffusion Transformers for 3D Camera Control

AC3D: Analyzing and Improving 3D Camera Control in Video Diffusion Transformers

Multi-subject Open-set Personalization in Video Generation

Improving the Diffusability of Autoencoders

4Real-Video: Learning Generalizable Photo-Realistic 4D Video Diffusion

Video Motion Transfer with Diffusion Transformers

DenseDPO: Fine-Grained Temporal Preference Optimization for Video Diffusion Models

GTR: Improving Large 3D Reconstruction Models through Geometry and Texture Refinement

Hierarchical Patch Diffusion Models for High-Resolution Video Generation

Mind the Time: Temporally-Controlled Multi-Event Video Generation

Deformable GANs for Pose-Based Human Image Generation

Animating Arbitrary Objects via Deep Motion Transfer

Unsupervised Domain Adaptation Using Feature-Whitening and Consensus Loss

Motion Representations for Articulated Animation

Playable Video Generation

Playable Environments: Video Manipulation in Space and Time

DisCoScene: Spatially Disentangled Generative Radiance Fields for Controllable 3D-Aware Scene Synthesis

Invertible Neural Skinning

3DAvatarGAN: Bridging Domains for Personalized Editable Avatars

Unsupervised Volumetric Animation

InfiniCity: Infinite-Scale City Synthesis

3D-Aware Semantic-Guided Generative Model for Human Synthesis

AV-Link: Temporally-Aligned Diffusion Features for Cross-Modal Audio-Video Generation

SPAD: Spatially Aware Multi-View Diffusers

Snap Video: Scaled Spatiotemporal Transformers for Text-to-Video Synthesis

Towards Text-guided 3D Scene Composition

First Order Motion Model for Image Animation

Autodecoding Latent 3D Diffusion Models