Most Cited 2024 &quot;monocular reconstruction&quot; Papers

AAAI 2024paperarXiv:2401.15657

#4802

Data-Free Generalized Zero-Shot Learning

Bowen Tang, Jing Zhang, Yan Long et al.

CVPR 2024highlightarXiv:2405.09546

#4803

BEHAVIOR Vision Suite: Customizable Dataset Generation via Simulation

Yunhao Ge, Yihe Tang, Jiashu Xu et al.

ECCV 2024arXiv:2409.15727

#4804

LaPose: Laplacian Mixture Shape Modeling for RGB-Based Category-Level Object Pose Estimation

Ruida Zhang, Ziqin Huang, Gu Wang et al.

CVPR 2024highlightarXiv:2312.09138

#4805

Living Scenes: Multi-object Relocalization and Reconstruction in Changing 3D Environments

Liyuan Zhu, Shengyu Huang, Konrad Schindler et al.

ECCV 2024arXiv:2407.06937

#4806

HumanRefiner: Benchmarking Abnormal Human Generation and Refining with Coarse-to-fine Pose-Reversible Guidance

Guian Fang, Wenbiao Yan, Yuanfan Guo et al.

ICLR 2024arXiv:2306.05426

#4807

SequenceMatch: Imitation Learning for Autoregressive Sequence Modelling with Backtracking

Chris Cundy, Stefano Ermon

#4808

PCE-Palm: Palm Crease Energy Based Two-Stage Realistic Pseudo-Palmprint Generation

Lei Shen, Jianlong Jin, Ruixin Zhang et al.

ECCV 2024arXiv:2407.07805

#4809

SUMix: Mixup with Semantic and Uncertain Information

Huafeng Qin, Xin Jin, Hongyu Zhu et al.

ICML 2024arXiv:2311.12997

#4810

Compositional Capabilities of Autoregressive Transformers: A Study on Synthetic, Interpretable Tasks

Rahul Ramesh, Ekdeep Singh Lubana, Mikail Khona et al.

#4811

A Twist for Graph Classification: Optimizing Causal Information Flow in Graph Neural Networks

Zhe Zhao, Pengkun Wang, HaiBin Wen et al.

ECCV 2024arXiv:2407.13524

#4812

Enhancing Source-Free Domain Adaptive Object Detection with Low-confidence Pseudo Label Distillation

Ilhoon Yoon, Hyeongjun Kwon, Jin Kim et al.

ICML 2024arXiv:2402.06119

#4813

ContPhy: Continuum Physical Concept Learning and Reasoning from Videos

Zhicheng Zheng, Xin Yan, Zhenfang Chen et al.

ICLR 2024arXiv:2311.08362

#4814

Transformers can optimally learn regression mixture models

Reese Pathak, Rajat Sen, Weihao Kong et al.

AAAI 2024paperarXiv:2312.08774

#4815

VSFormer: Visual-Spatial Fusion Transformer for Correspondence Pruning

Tangfei Liao, Xiaoqin Zhang, Li Zhao et al.

CVPR 2024arXiv:2405.09879

#4816

Generative Unlearning for Any Identity

Juwon Seo, Sung-Hoon Lee, Tae-Young Lee et al.

ICLR 2024arXiv:2306.00561

#4817

Masked Autoencoders with Multi-Window Local-Global Attention Are Better Audio Learners

Sarthak Yadav, Sergios Theodoridis, Lars Kai Hansen et al.

ECCV 2024arXiv:2403.12906

#4818

TexDreamer: Towards Zero-Shot High-Fidelity 3D Human Texture Generation

Yufei Liu, Junwei Zhu, Junshu Tang et al.

CVPR 2024highlightarXiv:2403.00691

#4819

Tri-Modal Motion Retrieval by Learning a Joint Embedding Space

Kangning Yin, Shihao Zou, Yuxuan Ge et al.

ICLR 2024arXiv:2305.19473

#4820

Chain of Log-Concave Markov Chains

Saeed Saremi, Ji Won Park, Francis Bach

ECCV 2024arXiv:2407.08801

#4821

DG-PIC: Domain Generalized Point-In-Context Learning for Point Cloud Understanding

Jincen Jiang, Qianyu Zhou, Yuhang Li et al.

ICLR 2024arXiv:2305.14718

#4822

Leftover Lunch: Advantage-based Offline Reinforcement Learning for Language Models

Ashutosh Baheti, Ximing Lu, Faeze Brahman et al.

ECCV 2024arXiv:2404.04933

#4823

UniMD: Towards Unifying Moment Retrieval and Temporal Action Detection

Yingsen Zeng, Yujie Zhong, Chengjian Feng et al.

CVPR 2024arXiv:2404.12209

#4824

Partial-to-Partial Shape Matching with Geometric Consistency

Viktoria Ehm, Maolin Gao, Paul Roetzer et al.

CVPR 2024arXiv:2403.17420

#4825

Learning to Visually Localize Sound Sources from Mixtures without Prior Source Knowledge

Dongjin Kim, Sung Jin Um, Sangmin Lee et al.

CVPR 2024arXiv:2402.08657

#4826

PIN: Positional Insert Unlocks Object Localisation Abilities in VLMs

Michael Dorkenwald, Nimrod Barazani, Cees G. M. Snoek et al.

ECCV 2024arXiv:2410.20769

#4827

CardiacNet: Learning to Reconstruct Abnormalities for Cardiac Disease Assessment from Echocardiogram Videos

JIEWEN YANG, Yiqun Lin, Bin Pu et al.

ICML 2024arXiv:2405.18080

#4828

HarmoDT: Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning

Shengchao Hu, Ziqing Fan, Li Shen et al.

ICML 2024arXiv:2402.11111

#4829

Language Models as Science Tutors

Alexis Chevalier, Jiayi Geng, Alexander Wettig et al.

ICLR 2024arXiv:2403.04551

#4830

Dissecting Sample Hardness: A Fine-Grained Analysis of Hardness Characterization Methods for Data-Centric AI

Nabeel Seedat, Fergus Imrie, Mihaela van der Schaar

ECCV 2024arXiv:2403.17103

#4831

Animal Avatars: Reconstructing Animatable 3D Animals from Casual Videos

Remy Sabathier, David Novotny, Niloy Mitra

ECCV 2024arXiv:2403.07369

#4832

Textual Knowledge Matters: Cross-Modality Co-Teaching for Generalized Visual Class Discovery

Haiyang Zheng, Pu Nan, Wenjing Li et al.

AAAI 2024paperarXiv:2401.07567

#4833

Bias-Conflict Sample Synthesis and Adversarial Removal Debias Strategy for Temporal Sentence Grounding in Video

Zhaobo Qi, Yibo Yuan, Xiaowen Ruan et al.

ICML 2024arXiv:2406.02873

#4834

Prediction-powered Generalization of Causal Inferences

Ilker Demirel, Ahmed Alaa, Anthony Philippakis et al.

ICLR 2024arXiv:2310.06089

#4835

Predictive auxiliary objectives in deep RL mimic learning in the brain

Ching Fang, Kimberly Stachenfeld

ICML 2024arXiv:2405.06855

#4836

Linear Explanations for Individual Neurons

Tuomas Oikarinen, Lily Weng

#4837

Aligner$^2$: Enhancing Joint Multiple Intent Detection and Slot Filling via Adjustive and Forced Cross-Task Alignment

Zhihong Zhu, Xuxin Cheng, Yaowei Li et al.

CVPR 2024arXiv:2404.00485

#4838

DiffHuman: Probabilistic Photorealistic 3D Reconstruction of Humans

Akash Sengupta, Thiemo Alldieck, NIKOS KOLOTOUROS et al.

ECCV 2024arXiv:2403.11929

#4839

LayerDiff: Exploring Text-guided Multi-layered Composable Image Synthesis via Layer-Collaborative Diffusion Model

Runhui Huang, Kaixin Cai, Jianhua Han et al.

CVPR 2024arXiv:2404.04876

#4840

HiLo: Detailed and Robust 3D Clothed Human Reconstruction with High-and Low-Frequency Information of Parametric Models

Yifan Yang, Dong Liu, Shuhai Zhang et al.

ICLR 2024arXiv:2301.10774

#4841

RDesign: Hierarchical Data-efficient Representation Learning for Tertiary Structure-based RNA Design

Cheng Tan, Yijie Zhang, Zhangyang Gao et al.

AAAI 2024paperarXiv:2402.11424

#4842

Data Distribution Distilled Generative Model for Generalized Zero-Shot Recognition

Yijie Wang, Mingjian Hong, Luwen Huangfu et al.

CVPR 2024arXiv:2402.08922

#4843

The Mirrored Influence Hypothesis: Efficient Data Influence Estimation by Harnessing Forward Passes

Myeongseob Ko, Feiyang Kang, Weiyan Shi et al.

AAAI 2024paperarXiv:2312.06867

#4844

Get an A in Math: Progressive Rectification Prompting

Zhenyu Wu, Meng Jiang, Chao Shen

#4845

Structural Information Enhanced Graph Representation for Link Prediction

Lei Shi, Bin Hu, Deng Zhao et al.

ECCV 2024arXiv:2311.11533

#4846

Event Camera Data Dense Pre-training

Yan Yang, Liyuan Pan, Liu liu

ICML 2024arXiv:2405.02449

#4847

Quality-Weighted Vendi Scores And Their Application To Diverse Experimental Design

Quan Nguyen, Adji Bousso Dieng

AAAI 2024paperarXiv:2401.03468

#4848

Multichannel AV-wav2vec2: A Framework for Learning Multichannel Multi-Modal Speech Representation

Qiushi Zhu, Jie Zhang, Yu Gu et al.

CVPR 2024arXiv:2404.00928

#4849

Instance-Aware Group Quantization for Vision Transformers

Jaehyeon Moon, Dohyung Kim, Jun Yong Cheon et al.

ECCV 2024arXiv:2409.13475

#4850

PLOT: Text-based Person Search with Part Slot Attention for Corresponding Part Discovery

Jicheol Park, Dongwon Kim, Boseung Jeong et al.

ECCV 2024arXiv:2312.03517

#4851

FRDiff : Feature Reuse for Universal Training-free Acceleration of Diffusion Models

Junhyuk So, Jungwon Lee, Eunhyeok Park

CVPR 2024arXiv:2402.08622

#4852

NeRF Analogies: Example-Based Visual Attribute Transfer for NeRFs

Michael Fischer, Zhengqin Li, Thu Nguyen-Phuoc et al.

ICLR 2024arXiv:2310.09827

#4853

VFLAIR: A Research Library and Benchmark for Vertical Federated Learning

TIANYUAN ZOU, Zixuan GU, Yu He et al.

ICML 2024arXiv:2212.04486

#4854

A New Linear Scaling Rule for Private Adaptive Hyperparameter Optimization

Ashwinee Panda, Xinyu Tang, Saeed Mahloujifar et al.

CVPR 2024arXiv:2311.15803

#4855

SOAC: Spatio-Temporal Overlap-Aware Multi-Sensor Calibration using Neural Radiance Fields

Quentin HERAU, Nathan Piasco, Moussab Bennehar et al.

ICML 2024arXiv:2406.07955

#4856

How Interpretable Are Interpretable Graph Neural Networks?

Yongqiang Chen, Yatao Bian, Bo Han et al.

ICML 2024arXiv:2405.03342

#4857

Doubly Robust Causal Effect Estimation under Networked Interference via Targeted Learning

Weilin Chen, Ruichu Cai, Zeqin Yang et al.

AAAI 2024paperarXiv:2308.09393

#4858

Learning MDL Logic Programs from Noisy Data

Céline Hocquette, Andreas Niskanen, Matti Järvisalo et al.

ICLR 2024arXiv:2309.05527

#4859

ReSimAD: Zero-Shot 3D Domain Transfer for Autonomous Driving with Source Reconstruction and Target Simulation

Bo Zhang, Xinyu Cai, Jiakang Yuan et al.

AAAI 2024paperarXiv:2312.15906

#4860

Improving Transferability for Cross-Domain Trajectory Prediction via Neural Stochastic Differential Equation

Daehee Park, Jaewoo Jeong, Kuk-Jin Yoon

#4861

Cyclic Learning for Binaural Audio Generation and Localization

Zhaojian Li, Bin Zhao, Yuan Yuan

CVPR 2024highlightarXiv:2405.00900

#4862

LidaRF: Delving into Lidar for Neural Radiance Field on Street Scenes

Shanlin Sun, Bingbing Zhuang, Ziyu Jiang et al.

ICLR 2024arXiv:2310.00386

#4863

Order-Preserving GFlowNets

Yihang Chen, Lukas Mauch

ICLR 2024arXiv:2309.00384

#4864

BatchPrompt: Accomplish more with less

Jianzhe Lin, Maurice Diesendruck, Liang Du et al.

CVPR 2024arXiv:2212.06872

#4865

Comparing the Decision-Making Mechanisms by Transformers and CNNs via Explanation Methods

Mingqi Jiang, Saeed Khorram, Li Fuxin

AAAI 2024paperarXiv:2311.09077

#4866

Spiking NeRF: Representing the Real-World Geometry by a Discontinuous Representation

Zhanfeng Liao, Yan Liu, Qian Zheng et al.

CVPR 2024arXiv:2403.03477

#4867

Continual Segmentation with Disentangled Objectness Learning and Class Recognition

Yizheng Gong, Siyue Yu, Xiaoyang Wang et al.

AAAI 2024paperarXiv:2402.18583

#4868

Binding-Adaptive Diffusion Models for Structure-Based Drug Design

ECCV 2024arXiv:2404.17507

#4869

HYPE: Hyperbolic Entailment Filtering for Underspecified Images and Texts

Wonjae Kim, Sanghyuk Chun, Taekyung Kim et al.

ICLR 2024arXiv:2401.12205

#4870

Retrieval-Guided Reinforcement Learning for Boolean Circuit Minimization

Animesh Basak Chowdhury, Marco Romanelli, Benjamin Tan et al.

AAAI 2024paperarXiv:2312.08763

#4871

Learning from Polar Representation: An Extreme-Adaptive Model for Long-Term Time Series Forecasting

Yanhong Li, Jack Xu, David Anastasiu

AAAI 2024paperarXiv:2403.10068

#4872

What Makes Good Collaborative Views? Contrastive Mutual Information Maximization for Multi-Agent Perception

Wanfang Su, Lixing Chen, Yang Bai et al.

AAAI 2024paperarXiv:2402.16013

#4873

Semi-supervised Open-World Object Detection

Sahal Shaji Mullappilly, Abhishek Singh Gehlot, Rao Muhammad Anwer et al.

AAAI 2024paperarXiv:2312.09095

#4874

ColNeRF: Collaboration for Generalizable Sparse Input Neural Radiance Field

Zhangkai Ni, Peiqi Yang, Wenhan Yang et al.

ICLR 2024arXiv:2311.04163

#4875

Outliers with Opposing Signals Have an Outsized Effect on Neural Network Optimization

Elan Rosenfeld, Andrej Risteski

ICLR 2024arXiv:2310.08833

#4876

Optimal Sample Complexity for Average Reward Markov Decision Processes

Shengbo Wang, Jose Blanchet, Peter Glynn

ECCV 2024arXiv:2407.04208

#4877

AMD: Automatic Multi-step Distillation of Large-scale Vision Models

Cheng Han, Qifan Wang, Sohail A Dianat et al.

ICML 2024arXiv:2402.12284

#4878

Refining Minimax Regret for Unsupervised Environment Design

Michael Beukman, Samuel Coward, Michael Matthews et al.

ICLR 2024spotlightarXiv:2305.17400

#4879

Query-Policy Misalignment in Preference-Based Reinforcement Learning

Xiao Hu, Jianxiong Li, Xianyuan Zhan et al.

ECCV 2024arXiv:2407.02685

#4880

Open Panoramic Segmentation

Junwei Zheng, Ruiping Liu, Yufan Chen et al.

CVPR 2024arXiv:2405.08815

#4881

Efficient Vision-Language Pre-training by Cluster Masking

Zihao Wei, Zixuan Pan, Andrew Owens

CVPR 2024arXiv:2404.04936

#4882

Bootstrapping Chest CT Image Understanding by Distilling Knowledge from X-ray Expert Models

Weiwei Cao, Jianpeng Zhang, Yingda Xia et al.

AAAI 2024paperarXiv:2306.04474

#4883

FoSp: Focus and Separation Network for Early Smoke Segmentation

Lujian Yao, Haitao Zhao, Jingchao Peng et al.

ICML 2024arXiv:2401.02949

#4884

Graph2Tac: Online Representation Learning of Formal Math Concepts

Lasse Blaauwbroek, Mirek Olšák, Jason Rute et al.

AAAI 2024paperarXiv:2312.07126

#4885

Deep Hierarchical Video Compression

Ming Lu, Zhihao Duan, Fengqing Zhu et al.

ICLR 2024arXiv:2401.14578

#4886

GOAt: Explaining Graph Neural Networks via Graph Output Attribution

Shengyao Lu, Keith G Mills, Jiao He et al.

ECCV 2024arXiv:2310.09739

#4887

AugUndo: Scaling Up Augmentations for Monocular Depth Completion and Estimation

Yangchao Wu, Tian Yu Liu, Hyoungseob Park et al.

ICLR 2024arXiv:2310.04612

#4888

A Topological Perspective on Demystifying GNN-Based Link Prediction Performance

Yu Wang, Tong Zhao, Yuying Zhao et al.

CVPR 2024arXiv:2403.08019

#4889

MRC-Net: 6-DoF Pose Estimation with MultiScale Residual Correlation

Yuelong Li, Yafei Mao, Raja Bala et al.

ICML 2024arXiv:2402.15853

#4890

RAUCA: A Novel Physical Adversarial Attack on Vehicle Detectors via Robust and Accurate Camouflage Generation

Jiawei Zhou, Linye Lyu, Daojing He et al.

ICLR 2024arXiv:2310.01391

#4891

A Restoration Network as an Implicit Prior

Yuyang Hu, Mauricio Delbracio, Peyman Milanfar et al.

ECCV 2024arXiv:2406.04551

#4892

Improving Geo-diversity of Generated Images with Contextualized Vendi Score Guidance

Reyhane Askari Hemmat, Melissa Hall, Alicia Yi Sun et al.

CVPR 2024arXiv:2311.17948

#4893

Action-slot: Visual Action-centric Representations for Multi-label Atomic Activity Recognition in Traffic Scenes

Chi-Hsi Kung, 書緯呂, Yi-Hsuan Tsai et al.

ICLR 2024arXiv:2310.06347

#4894

JointNet: Extending Text-to-Image Diffusion for Dense Distribution Modeling

Jingyang Zhang, Shiwei Li, Yuanxun Lu et al.

CVPR 2024arXiv:2403.07214

#4895

Text-to-Image Diffusion Models are Great Sketch-Photo Matchmakers

Subhadeep Koley, Ayan Kumar Bhunia, Aneeshan Sain et al.

AAAI 2024paperarXiv:2312.06069

#4896

Mining Gaze for Contrastive Learning toward Computer-Assisted Diagnosis

Authors: Zihao Zhao, Sheng Wang, Qian Wang et al.

AAAI 2024paperarXiv:2312.06273

#4897

Regroup Median Loss for Combating Label Noise

Authors: Fengpeng Li, Kemou Li, Jinyu Tian et al.

CVPR 2024arXiv:2401.02411

#4898

What You See is What You GAN: Rendering Every Pixel for High-Fidelity Geometry in 3D GANs

Alex Trevithick, Matthew Chan, Towaki Takikawa et al.

ICLR 2024arXiv:2309.14681

#4899

Are Human-generated Demonstrations Necessary for In-context Learning?

Rui Li, Guoyin Wang, Jiwei Li

ECCV 2024arXiv:2404.09977

#4900

MaxFusion: Plug&Play Multi-Modal Generation in Text-to-Image Diffusion Models

Nithin Gopalakrishnan Nair, Jeya Maria Jose Valanarasu, Vishal Patel

CVPR 2024arXiv:2311.11837

#4901

Kandinsky Conformal Prediction: Efficient Calibration of Image Segmentation Algorithms

Joren Brunekreef, Eric Marcus, Ray Sheombarsing et al.

AAAI 2024paperarXiv:2402.18493

#4902

Sunshine to Rainstorm: Cross-Weather Knowledge Distillation for Robust 3D Object Detection

Xun Huang, Hai Wu, Xin Li et al.

CVPR 2024arXiv:2306.12547

#4903

DGC-GNN: Leveraging Geometry and Color Cues for Visual Descriptor-Free 2D-3D Matching

Shuzhe Wang, Juho Kannala, Daniel Barath

CVPR 2024arXiv:2312.04248

#4904

TeMO: Towards Text-Driven 3D Stylization for Multi-Object Meshes

Xuying Zhang, Bo-Wen Yin, yuming chen et al.

#4905

Bidirectional Autoregessive Diffusion Model for Dance Generation

Canyu Zhang, Youbao Tang, NING Zhang et al.

CVPR 2024arXiv:2311.18303

#4906

OmniMotionGPT: Animal Motion Generation with Limited Data

Zhangsihao Yang, Mingyuan Zhou, Mengyi Shan et al.

ECCV 2024arXiv:2404.09942

#4907

Knowledge-enhanced Visual-Language Pretraining for Computational Pathology

Xiao Zhou, Xiaoman Zhang, Chaoyi Wu et al.

CVPR 2024arXiv:2404.01278

#4908

BiPer: Binary Neural Networks using a Periodic Function

Edwin Vargas, Claudia Correa, Carlos Hinojosa et al.

CVPR 2024arXiv:2405.10185

#4909

DiverGen: Improving Instance Segmentation by Learning Wider Data Distribution with More Diverse Generative Data

Chengxiang Fan, Muzhi Zhu, Hao Chen et al.

CVPR 2024arXiv:2405.17765

#4910

PTM-VQA: Efficient Video Quality Assessment Leveraging Diverse PreTrained Models from the Wild

Kun Yuan, Hongbo Liu, Mading Li et al.

ICML 2024arXiv:2310.09202

#4911

Graph Distillation with Eigenbasis Matching

Yang Liu, Deyu Bo, Chuan Shi

CVPR 2024arXiv:2312.05856

#4912

A Video is Worth 256 Bases: Spatial-Temporal Expectation-Maximization Inversion for Zero-Shot Video Editing

Li Maomao, Yu Li, Tianyu Yang et al.

ICLR 2024arXiv:2402.11984

#4913

Hebbian Learning based Orthogonal Projection for Continual Learning of Spiking Neural Networks

Mingqing Xiao, Qingyan Meng, Zongpeng Zhang et al.

ECCV 2024arXiv:2407.10831

#4914

Temporal Event Stereo via Joint Learning with Stereoscopic Flow

Hoonhee Cho, Jae-young Kang, Kuk-Jin Yoon

ECCV 2024arXiv:2403.09500

#4915

Faceptor: A Generalist Model for Face Perception

Lixiong Qin, Mei Wang, Xuannan Liu et al.

ECCV 2024arXiv:2406.07516

#4916

Instant 3D Human Avatar Generation using Image Diffusion Models

Nikos Kolotouros, Thiemo Alldieck, Enric Corona et al.

CVPR 2024arXiv:2404.04458

#4917

JRDB-Social: A Multifaceted Robotic Dataset for Understanding of Context and Dynamics of Human Interactions Within Social Groups

Simindokht Jahangard, Zhixi Cai, Shiki Wen et al.

CVPR 2024arXiv:2403.17782

#4918

GenesisTex: Adapting Image Denoising Diffusion to Texture Space

Chenjian Gao, Boyan Jiang, Xinghui Li et al.

CVPR 2024arXiv:2311.10696

#4919

Versatile Medical Image Segmentation Learned from Multi-Source Datasets via Model Self-Disambiguation

Xiaoyang Chen, Hao Zheng, Yuemeng LI et al.

ICML 2024arXiv:2406.01072

#4920

Towards efficient deep spiking neural networks construction with spiking activity based pruning

Yaxin Li, Qi Xu, Jiangrong Shen et al.

ICLR 2024arXiv:2306.08247

#4921

Diffusion in Diffusion: Cyclic One-Way Diffusion for Text-Vision-Conditioned Generation

Ruoyu Wang, Yongqi Yang, Zhihao Qian et al.

ECCV 2024arXiv:2407.16497

#4922

Dynamic Retraining-Updating Mean Teacher for Source-Free Object Detection

BA KHANH TRINH LE, Huy-Hung Nguyen, Long Hoang Pham et al.

ECCV 2024arXiv:2308.04526

#4923

Large-Scale Multi-Hypotheses Cell Tracking Using Ultrametric Contours Maps

Jordao Bragantini, Merlin Lange, Loïc A Royer

ECCV 2024arXiv:2405.19882

#4924

PixOOD: Pixel-Level Out-of-Distribution Detection

Tomas Vojir, Jan Sochman, Jiri Matas

CVPR 2024arXiv:2402.10401

#4925

ManiFPT: Defining and Analyzing Fingerprints of Generative Models

Hae Jin Song, Mahyar Khayatkhoei, Wael AbdAlmageed

#4926

Quad Bayer Joint Demosaicing and Denoising Based on Dual Encoder Network with Joint Residual Learning

Bolun Zheng, Li Haoran, Quan Chen et al.

ECCV 2024arXiv:2402.19150

#4927

Unveiling Typographic Deceptions: Insights of the Typographic Vulnerability in Large Vision-Language Models

Hao Cheng, Erjia Xiao, Jindong Gu et al.

ICML 2024arXiv:2405.14959

#4928

EvGGS: A Collaborative Learning Framework for Event-based Generalizable Gaussian Splatting

Jiaxu Wang, Junhao He, Ziyi Zhang et al.

ICLR 2024spotlightarXiv:2403.04929

#4929

On the Markov Property of Neural Algorithmic Reasoning: Analyses and Methods

Montgomery Bohde, Meng Liu, Alexandra Saxton et al.

#4930

Improving Spectral Snapshot Reconstruction with Spectral-Spatial Rectification

Jiancheng Zhang, Haijin Zeng, Yongyong Chen et al.

#4931

Hypergraph Joint Representation Learning for Hypervertices and Hyperedges via Cross Expansion

Yuguang Yan, Yuanlin Chen, Shibo Wang et al.

ICML 2024arXiv:2402.14688

#4932

Q-Probe: A Lightweight Approach to Reward Maximization for Language Models

Kenneth Li, Samy Jelassi, Hugh Zhang et al.

CVPR 2024arXiv:2404.10227

#4933

MS-MANO: Enabling Hand Pose Tracking with Biomechanical Constraints

Pengfei Xie, Wenqiang Xu, Tutian Tang et al.

CVPR 2024arXiv:2403.07346

#4934

Complementing Event Streams and RGB Frames for Hand Mesh Reconstruction

Jianping Jiang, xinyu zhou, Bingxuan Wang et al.

CVPR 2024arXiv:2404.01775

#4935

A Noisy Elephant in the Room: Is Your Out-of-Distribution Detector Robust to Label Noise?

Galadrielle Humblot-Renaux, Sergio Escalera, Thomas B. Moeslund

AAAI 2024paperarXiv:2310.13356

#4936

Sync-NeRF: Generalizing Dynamic NeRFs to Unsynchronized Videos

Seoha Kim, Jeongmin Bae, Youngsik Yun et al.

AAAI 2024paperarXiv:2208.09569

#4937

Unit Selection with Nonbinary Treatment and Effect

Ang Li, Judea Pearl

ICML 2024spotlightarXiv:2311.08675

#4938

Refined Coreset Selection: Towards Minimal Coreset Size under Model Performance Constraints

Xiaobo Xia, Jiale Liu, Shaokun Zhang et al.

ICLR 2024arXiv:2311.15961

#4939

Maximum Likelihood Estimation is All You Need for Well-Specified Covariate Shift

Jiawei Ge, Shange Tang, Jianqing Fan et al.

ICLR 2024arXiv:2310.00817

#4940

Learning to Make Adherence-aware Advice

Guanting Chen, Xiaocheng Li, Chunlin Sun et al.

CVPR 2024arXiv:2403.05086

#4941

UFORecon: Generalizable Sparse-View Surface Reconstruction from Arbitrary and Unfavorable Sets

Youngju Na, Woo Jae Kim, Kyu Han et al.

ICML 2024arXiv:2407.11942

#4942

Context-Guided Diffusion for Out-of-Distribution Molecular and Protein Design

Leo Klarner, Tim G. J. Rudner, Garrett Morris et al.

ICLR 2024arXiv:2308.01313

#4943

PerceptionCLIP: Visual Classification by Inferring and Conditioning on Contexts

Bang An, Sicheng Zhu, Michael-Andrei Panaitescu-Liess et al.

ICLR 2024arXiv:2402.17316

#4944

Towards Robust and Efficient Cloud-Edge Elastic Model Adaptation via Selective Entropy Distillation

Yaofo Chen, Shuaicheng Niu, Yaowei Wang et al.

ICLR 2024arXiv:2310.06171

#4945

Memory-Consistent Neural Networks for Imitation Learning

Kaustubh Sridhar, Souradeep Dutta, Dinesh Jayaraman et al.

AAAI 2024paperarXiv:2312.11198

#4946

Signed Graph Neural Ordinary Differential Equation for Modeling Continuous-Time Dynamics

Lanlan Chen, Kai Wu, Jian Lou et al.

CVPR 2024arXiv:2404.02788

#4947

GenN2N: Generative NeRF2NeRF Translation

Xiangyue Liu, Han Xue, Kunming Luo et al.

ICML 2024arXiv:2303.08816

#4948

Borda Regret Minimization for Generalized Linear Dueling Bandits

Yue Wu, Tao Jin, Qiwei Di et al.

ICML 2024arXiv:2403.12995

#4949

ESM All-Atom: Multi-Scale Protein Language Model for Unified Molecular Modeling

Kangjie Zheng, Siyu Long, Tianyu Lu et al.

ICML 2024arXiv:2405.06822

#4950

MH-pFLID: Model Heterogeneous personalized Federated Learning via Injection and Distillation for Medical Data Analysis

Luyuan Xie, Manqing Lin, Tianyu Luan et al.

ECCV 2024arXiv:2408.10777

#4951

Just a Hint: Point-Supervised Camouflaged Object Detection

Huafeng Chen, Dian SHAO, Guangqian Guo et al.

ECCV 2024arXiv:2408.00297

#4952

EmoTalk3D: High-Fidelity Free-View Synthesis of Emotional 3D Talking Head

Qianyun He, Xinya Ji, Yicheng Gong et al.

#4953

Tensorized Label Learning on Anchor Graph

Jing Li, Quanxue Gao, Qianqian Wang et al.

ECCV 2024arXiv:2407.14138

#4954

Visual Text Generation in the Wild

Yuanzhi Zhu, Jiawei Liu, Feiyu Gao et al.

ECCV 2024arXiv:2407.11700

#4955

Rate-Distortion-Cognition Controllable Versatile Neural Image Compression

Jinming Liu, Ruoyu Feng, Yunpeng Qi et al.

AAAI 2024paperarXiv:2312.15909

#4956

Generalizable Task Representation Learning for Offline Meta-Reinforcement Learning with Data Limitations

Renzhe Zhou, Chen-Xiao Gao, Zongzhang Zhang et al.

CVPR 2024arXiv:2402.18192

#4957

Misalignment-Robust Frequency Distribution Loss for Image Transformation

Zhangkai Ni, Juncheng Wu, Zian Wang et al.

ICLR 2024arXiv:2402.18813

#4958

Protein Multimer Structure Prediction via Prompt Learning

Ziqi Gao, Xiangguo SUN, Zijing Liu et al.

CVPR 2024arXiv:2312.13091

#4959

MoSAR: Monocular Semi-Supervised Model for Avatar Reconstruction using Differentiable Shading

Abdallah Dib, Luiz Gustavo Hafemann, Emeline Got et al.

#4960

Learning to Learn Better Visual Prompts

Fengxiang Wang, Wanrong Huang, Shaowu Yang et al.

ICML 2024arXiv:2402.13505

#4961

SimPro: A Simple Probabilistic Framework Towards Realistic Long-Tailed Semi-Supervised Learning

Chaoqun Du, Yizeng Han, Gao Huang

ICML 2024oralarXiv:2308.14906

#4962

BayOTIDE: Bayesian Online Multivariate Time Series Imputation with Functional Decomposition

Shikai Fang, Qingsong Wen, Yingtao Luo et al.

#4963

Event-Adapted Video Super-Resolution

Zeyu Xiao, Dachun Kai, Yueyi Zhang et al.

ECCV 2024

CVPR 2024arXiv:2406.05271

#4964

USE: Universal Segment Embeddings for Open-Vocabulary Image Segmentation

Xiaoqi Wang, Wenbin He, Xiwei Xuan et al.

ECCV 2024arXiv:2407.14126

#4965

Mono-ViFI: A Unified Learning Framework for Self-supervised Single- and Multi-frame Monocular Depth Estimation

Jinfeng Liu, Lingtong Kong, Bo Li et al.

ECCV 2024arXiv:2407.06540

#4966

General and Task-Oriented Video Segmentation

Mu Chen, Liulei Li, Wenguan Wang et al.

AAAI 2024paperarXiv:2312.10422

#4967

Learning Dense Correspondence for NeRF-Based Face Reenactment

Songlin Yang, Wei Wang, Yushi Lan et al.

ICLR 2024spotlightarXiv:2401.09516

#4968

Accelerating Data Generation for Neural Operators via Krylov Subspace Recycling

Hong Wang, Zhongkai Hao, Jie Wang et al.

AAAI 2024paperarXiv:2312.15717

#4969

Spatial-Temporal Interplay in Human Mobility: A Hierarchical Reinforcement Learning Approach with Hypergraph Representation

Zhaofan Zhang, Yanan Xiao, Lu Jiang et al.

CVPR 2024arXiv:2403.06974

#4970

Memory-based Adapters for Online 3D Scene Perception

Xiuwei Xu, Chong Xia, Ziwei Wang et al.

ICML 2024arXiv:2402.07101

#4971

On The Complexity of First-Order Methods in Stochastic Bilevel Optimization

Jeongyeol Kwon, Dohyun Kwon, Hanbaek Lyu

AAAI 2024paperarXiv:2305.15769

#4972

MERGE: Fast Private Text Generation

Zi Liang, Pinghui Wang, Ruofei Zhang et al.

#4973

CLIFF: Continual Latent Diffusion for Open-Vocabulary Object Detection

Wuyang Li, Xinyu Liu, Jiayi Ma et al.

ECCV 2024

ECCV 2024arXiv:2407.12593

#4974

EvSign: Sign Language Recognition and Translation with Streaming Events

Pengyu Zhang, Hao Yin, Zeren Wang et al.

AAAI 2024paperarXiv:2312.13630

#4975

MFABA: A More Faithful and Accelerated Boundary-Based Attribution Method for Deep Neural Networks

Zhiyu Zhu, Huaming Chen, Jiayu Zhang et al.

ECCV 2024arXiv:2311.15040

#4976

InstaStyle: Inversion Noise of a Stylized Image is Secretly a Style Adviser

Xing Cui, Zekun Li, Peipei Li et al.

ICLR 2024arXiv:2306.11201

#4977

Adaptive Federated Learning with Auto-Tuned Clients

Junhyung Lyle Kim, Mohammad Taha Toghani, Cesar Uribe et al.

#4978

Weakly Supervised Multimodal Affordance Grounding for Egocentric Images

Lingjing Xu, Yang Gao, Wenfeng Song et al.

ICML 2024arXiv:2402.04655

#4979

Open-Vocabulary Calibration for Fine-tuned CLIP

Shuoyuan Wang, Jindong Wang, Guoqing Wang et al.

ECCV 2024arXiv:2403.10942

#4980

ScanTalk: 3D Talking Heads from Unregistered Scans

Federico Nocentini, Thomas Besnier, Claudio Ferrari et al.

ICML 2024arXiv:2402.13937

#4981

Verifying message-passing neural networks via topology-based bounds tightening

Christopher Hojny, Shiqiang Zhang, Juan Campos et al.

#4982

UnionFormer: Unified-Learning Transformer with Multi-View Representation for Image Manipulation Detection and Localization

Shuaibo Li, Wei Ma, Jianwei Guo et al.

ICML 2024oralarXiv:2212.07892

#4983

Integrating Multimodal Data for Joint Generative Modeling of Complex Dynamics

Manuel Brenner, Florian Hess, Georgia Koppe et al.

ICLR 2024arXiv:2306.02031

#4984

DOS: Diverse Outlier Sampling for Out-of-Distribution Detection

Wenyu Jiang, Hao Cheng, MingCai Chen et al.

ECCV 2024arXiv:2403.17931

#4985

Track Everything Everywhere Fast and Robustly

Yunzhou Song, Jiahui Lei, Ziyun Wang et al.

ECCV 2024arXiv:2403.18241

#4986

NeuSDFusion: A Spatial-Aware Generative Model for 3D Shape Completion, Reconstruction, and Generation

Ruikai Cui, Weizhe Liu, Weixuan Sun et al.

ECCV 2024arXiv:2211.13220

#4987

TetraDiffusion: Tetrahedral Diffusion Models for 3D Shape Generation

Nikolai Kalischek, Torben Peters, Jan Dirk Wegner et al.

ICML 2024arXiv:2402.04971

#4988

Multi-Sender Persuasion: A Computational Perspective

Safwan Hossain, Tonghan Wang, Tao Lin et al.

CVPR 2024arXiv:2306.02240

#4989

ProTeCt: Prompt Tuning for Taxonomic Open Set Classification

Tz-Ying Wu, Chih-Hui Ho, Nuno Vasconcelos

#4990

3426 Regulating Intermediate 3D Features for Vision-Centric Autonomous Driving

Junkai Xu, Liang Peng, Haoran Cheng et al.

ICML 2024arXiv:2406.09241

#4991

What is the Long-Run Distribution of Stochastic Gradient Descent? A Large Deviations Analysis

Waïss Azizian, Franck Iutzeler, Jérôme Malick et al.

ICLR 2024arXiv:2305.18712

#4992

Can We Evaluate Domain Adaptation Models Without Target-Domain Labels?

JIANFEI YANG, Hanjie Qian, Yuecong Xu et al.

AAAI 2024paperarXiv:2312.09539

#4993

Situation-Dependent Causal Influence-Based Cooperative Multi-Agent Reinforcement Learning

Xiao Du, Yutong Ye, Pengyu Zhang et al.

AAAI 2024paperarXiv:2402.18411

#4994

Unsupervised Cross-Domain Image Retrieval via Prototypical Optimal Transport

Bin Li, Ye Shi, Qian Yu et al.

ECCV 2024arXiv:2407.17331

#4995

Multi-Label Cluster Discrimination for Visual Representation Learning

Xiang An, Kaicheng Yang, Xiangzi Dai et al.

#4996

Unifying Automatic and Interactive Matting with Pretrained ViTs

Zixuan Ye, Wenze Liu, He Guo et al.

#4997

Non-Exemplar Domain Incremental Learning via Cross-Domain Concept Integration

Qiang Wang, Yuhang He, Songlin Dong et al.

ECCV 2024

ICLR 2024arXiv:2310.07229

#4998

Self-supervised Pocket Pretraining via Protein Fragment-Surroundings Alignment

Bowen Gao, Yinjun JIA, Yuanle Mo et al.

ICML 2024arXiv:2406.07236

#4999

Let Go of Your Labels with Unsupervised Transfer

Artyom Gadetsky, Yulun Jiang, Maria Brbic

AAAI 2024paperarXiv:2311.13460

#5000

Multi-Objective Bayesian Optimization with Active Preference Learning

Ryota Ozaki, Kazuki Ishikawa, Youhei Kanzaki et al.