CVPR 2024 Papers

2,716 papers found • Page 4 of 55

Xiaofeng Cong, Jie Gui, Jing Zhang et al.

Haokai Pang, Heming Zhu, Adam Kortylewski et al.

Hongwei Ren, Jiadong Zhu, Yue Zhou et al.

zhishan zhou, shihao zhou, Zhi Lv et al.

Pinelopi Papalampidi, Skanda Koppula, Shreya Pathak et al.

Mohammad Fahes, TUAN-HUNG VU, Andrei Bursuc et al.

Seungwoo Yoo, Kunho Kim, Vladimir G. Kim et al.

Difei Gao, Lei Ji, Zechen Bai et al.

Xiaoyang Xu, Mengda Yang, Wenzhe Yi et al.

Yusheng Dai, HangChen, Jun Du et al.

Feng Yu, Teng Zhang, Gilad Lerman

Zhiyu Zhao, Bingkun Huang, Sen Xing et al.

Hanshi Wang, Zhipeng Zhang, Jin Gao et al.

Mani Ramanagopal, Sriram Narayanan, Aswin C. Sankaranarayanan et al.

Fan Zhang, Shaodi You, Yu Li et al.

Martijn Oldenhof, Edward De Brouwer, Adam Arany et al.

Samar Fares, Karthik Nandakumar

Yanbing Zhang, Mengping Yang, Qin Zhou et al.

Hongjie Wang, Difan Liu, Yan Kang et al.

Taeho Kang, Youngki Lee

Dongyoung Kim, Jinwoo Kim, Junsang Yu et al.

Yan Huang, Zhang Zhang, Qiang Wu et al.

Fan Yang, Tianyi Chen, XIAOSHENG HE et al.

Jinxiang Liu, Yikun Liu, Ferenas et al.

Shiwei Jin, Zhen Wang, Lei Wang et al.

Reni Paskaleva, Mykyta Holubakha, Andela Ilic et al.

Yufeng Zheng, Xueting Li, Koki Nagano et al.

Jiangnan Tang, Jingya Wang, Kaiyang Ji et al.

Yiteng Xu, Kecheng Ye, xiao han et al.

Yuelin Zhang, Pengyu Zheng, Wanquan Yan et al.

Gyeongsik Moon, Weipeng Xu, Rohan Joshi et al.

Tengda Han, Max Bain, Arsha Nagrani et al.

Xiaoyan Cong, Yue Wu, Qifeng Chen et al.

Hao Li, Xue Yang, Zhaokai Wang et al.

Jinxia Xie, Bineng Zhong, Zhiyi Mo et al.

Xidong Wu, Shangqian Gao, Zeyu Zhang et al.

Jeongsoo Choi, Se Jin Park, Minsu Kim et al.

Zixiang Zhou, Yu Wan, Baoyuan Wang

Xu Yang, Xuan chen, Moqi Li et al.

Trevine Oorloff, Surya Koppisetti, Nicolo Bonettini et al.

Zhixing Zhang, Bichen Wu, Xiaoyan Wang et al.

Li Maomao, Yu Li, Tianyu Yang et al.

Pratyusha Sharma, Tamar Rott Shaham, Manel Baradad et al.

Anton Ratnarajah, Sreyan Ghosh, Sonal Kumar et al.

Junghyup Lee, Bumsub Ham

Jiyang Guan, Jian Liang, Ran He

YANSHUO WANG, Ali Cheraghian, Zeeshan Hayder et al.

Thomas Wimmer, Peter Wonka, Maks Ovsjanikov

Siyuan Liang, Mingli Zhu, Aishan Liu et al.

Jiawang Bai, Kuofeng Gao, Shaobo Min et al.

CVPR 2024 Papers

Conference

Paper Type

A Semi-supervised Nighttime Dehazing Baseline with Spatial-Frequency Aware and Realistic Brightness Constraint

ASH: Animatable Gaussian Splats for Efficient and Photoreal Human Rendering

A Simple and Effective Point-based Network for Event Camera 6-DOFs Pose Relocalization

A Simple Baseline for Efficient Hand Mesh Reconstruction

A Simple Recipe for Contrastively Pre-training Video-First Encoders Beyond 16 Frames

A Simple Recipe for Language-guided Domain Generalized Segmentation

As-Plausible-As-Possible: Plausibility-Aware Mesh Deformation Using 2D Diffusion Priors

AssistGUI: Task-Oriented PC Graphical User Interface Automation

A Stealthy Wrongdoer: Feature-Oriented Reconstruction Attack against Split Learning

A Study of Dropout-Induced Modality Bias on Robustness to Missing Video Frames for Audio-Visual Speech Recognition

A Subspace-Constrained Tyler's Estimator and its Applications to Structure from Motion

Asymmetric Masked Distillation for Pre-Training Small Foundation Models

A-Teacher: Asymmetric Network for 3D Semi-Supervised Object Detection

A Theory of Joint Light and Heat Transport for Lambertian Scenes

Atlantis: Enabling Underwater Depth Estimation with Stable Diffusion

Atom-Level Optical Chemical Structure Recognition with Limited Supervision

Attack To Defend: Exploiting Adversarial Attacks for Detecting Poisoned Models

Attention Calibration for Disentangled Text-to-Image Personalization

Attention-Driven Training-Free Efficiency Enhancement of Diffusion Models

Attention-Propagation Network for Egocentric Heatmap to 3D Pose Lifting

Attentive Illumination Decomposition Model for Multi-Illuminant White Balancing

Attribute-Guided Pedestrian Retrieval: Bridging Person Re-ID with Internal Attribute Variability

AttriHuman-3D: Editable 3D Human Avatar Generation with Attribute Decomposition and Indexing

Audio-Visual Segmentation via Unlabeled Frame Exploitation

AUEditNet: Dual-Branch Facial Action Unit Intensity Manipulation with Implicit Disentanglement

A Unified and Interpretable Emotion Representation and Expression Generation

A Unified Approach for Text- and Image-guided 4D Scene Generation

A Unified Diffusion Framework for Scene-aware Human Motion Estimation from Sparse Signals

A Unified Framework for Human-centric Point Cloud Video Understanding

A Unified Framework for Microscopy Defocus Deblur with Multi-Pyramid Transformer and Contrastive Learning

Authentic Hand Avatar from a Phone Scan via Universal Hand Model

AutoAD III: The Prequel – Back to the Pixels

Automatic Controllable Colorization via Imagination

Auto MC-Reward: Automated Dense Reward Design with Large Language Models for Minecraft

Autoregressive Queries for Adaptive Tracking with Spatio-Temporal Transformers

Auto-Train-Once: Controller Network Guided Automatic Network Pruning from Scratch

AV2AV: Direct Audio-Visual Speech to Audio-Visual Speech Translation with Unified Audio-Visual Speech Representation

AvatarGPT: All-in-One Framework for Motion Understanding Planning Generation and Beyond

A Versatile Framework for Continual Test-Time Domain Adaptation: Balancing Discriminability and Generalizability

AVFF: Audio-Visual Feature Fusion for Video Deepfake Detection

AVID: Any-Length Video Inpainting with Diffusion Model

A Video is Worth 256 Bases: Spatial-Temporal Expectation-Maximization Inversion for Zero-Shot Video Editing

A Vision Check-up for Language Models

AV-RIR: Audio-Visual Room Impulse Response Estimation

AZ-NAS: Assembling Zero-Cost Proxies for Network Architecture Search

Backdoor Defense via Test-Time Detecting and Repairing

Backpropagation-free Network for 3D Test-time Adaptation

Back to 3D: Few-Shot 3D Keypoint Detection with Back-Projected 2D Features

BadCLIP: Dual-Embedding Guided Backdoor Attack on Multimodal Contrastive Learning

BadCLIP: Trigger-Aware Prompt Learning for Backdoor Attacks on CLIP