Most Cited 2024 &quot;genai model evaluation&quot; Papers

ECCV 2024arXiv:2309.12303

#5602

PanoVOS: Bridging Non-panoramic and Panoramic Views with Transformer for Video Segmentation

Shilin Yan, Xiaohao Xu, Renrui Zhang et al.

CVPR 2024arXiv:2312.04117

#5603

Instance Tracking in 3D Scenes from Egocentric Videos

Yunhan Zhao, Haoyu Ma, Shu Kong et al.

ECCV 2024arXiv:2407.15085

#5604

Learn to Preserve and Diversify: Parameter-Efficient Group with Orthogonal Regularization for Domain Generalization

Jiajun Hu, Jian Zhang, Lei Qi et al.

CVPR 2024arXiv:2403.04321

#5605

Discriminative Probing and Tuning for Text-to-Image Generation

Leigang Qu, Wenjie Wang, Yongqi Li et al.

CVPR 2024arXiv:2403.07432

#5606

Bring Event into RGB and LiDAR: Hierarchical Visual-Motion Fusion for Scene Flow

Hanyu Zhou, Yi Chang, Zhiwei Shi

AAAI 2024paperarXiv:2312.16418

#5607

Refining Latent Homophilic Structures over Heterophilic Graphs for Robust Graph Convolution Networks

Chenyang Qiu, Guoshun Nan, Tianyu Xiong et al.

ICLR 2024arXiv:2312.02230

#5608

A Simple and Scalable Representation for Graph Generation

Yunhui Jang, Seul Lee, Sungsoo Ahn

ECCV 2024arXiv:2403.12953

#5609

FutureDepth: Learning to Predict the Future Improves Video Depth Estimation

Rajeev Yasarla, Manish Kumar Singh, Hong Cai et al.

ECCV 2024arXiv:2312.14055

#5610

Multi-Sentence Grounding for Long-term Instructional Video

Zeqian Li, QIRUI CHEN, Tengda Han et al.

ICLR 2024arXiv:2312.03587

#5611

Language-Informed Visual Concept Learning

Sharon Lee, Yunzhi Zhang, Shangzhe Wu et al.

CVPR 2024arXiv:2312.01215

#5612

RNb-NeuS: Reflectance and Normal-based Multi-View 3D Reconstruction

Baptiste Brument, Robin Bruneau, Yvain Queau et al.

#5613

R-EDL: Relaxing Nonessential Settings of Evidential Deep Learning

Mengyuan Chen, Junyu Gao, Changsheng Xu

ICLR 2024spotlight

ECCV 2024arXiv:2407.09648

#5614

3x2: 3D Object Part Segmentation by 2D Semantic Correspondences

Anh Thai, Weiyao Wang, Hao Tang et al.

AAAI 2024paperarXiv:2401.04984

#5615

MGNet: Learning Correspondences via Multiple Graphs

Dai Luanyuan, Xiaoyu Du, Hanwang Zhang et al.

ICML 2024arXiv:2402.15989

#5616

PIDformer: Transformer Meets Control Theory

Tam Nguyen, Cesar Uribe, Tan Nguyen et al.

ICML 2024arXiv:2403.02695

#5617

Controllable Prompt Tuning For Balancing Group Distributional Robustness

Hoang Phan, Andrew Wilson, Qi Lei

ECCV 2024arXiv:2407.10164

#5618

LabelDistill: Label-guided Cross-modal Knowledge Distillation for Camera-based 3D Object Detection

Sanmin Kim, Youngseok Kim, Sihwan Hwang et al.

CVPR 2024arXiv:2404.02227

#5619

OOSTraj: Out-of-Sight Trajectory Prediction With Vision-Positioning Denoising

Haichao Zhang, Yi Xu, Hongsheng Lu et al.

ECCV 2024arXiv:2312.10993

#5620

Realistic Human Motion Generation with Cross-Diffusion Models

Zeping Ren, Shaoli Huang, Xiu Li

ICLR 2024arXiv:2310.04297

#5621

A Plug-and-Play Image Registration Network

JUNHAO HU, Weijie Gan, Zhixin Sun et al.

AAAI 2024paperarXiv:2312.07132

#5622

Image Content Generation with Causal Reasoning

Xiaochuan Li, Baoyu Fan, Run Zhang et al.

ICLR 2024arXiv:2311.04453

#5623

Lewis's Signaling Game as beta-VAE For Natural Word Lengths and Segments

Ryo Ueda, TADAHIRO TANIGUCHI

ECCV 2024arXiv:2312.02319

#5624

Kernel Diffusion: An Alternate Approach to Blind Deconvolution

Yash Sanghvi, Yiheng Chi, Stanley Chan

ICML 2024arXiv:2310.15351

#5625

Random Exploration in Bayesian Optimization: Order-Optimal Regret and Computational Efficiency

Sudeep Salgia, Sattar Vakili, Qing Zhao

AAAI 2024paperarXiv:2401.07062

#5626

Dirichlet-Based Prediction Calibration for Learning with Noisy Labels

Chen-Chen Zong, Ye-Wen Wang, Ming-Kun Xie et al.

CVPR 2024highlightarXiv:2403.19314

#5627

Total-Decom: Decomposed 3D Scene Reconstruction with Minimal Interaction

Xiaoyang Lyu, Chirui Chang, Peng Dai et al.

ECCV 2024arXiv:2406.00474

#5628

Adapting Fine-Grained Cross-View Localization to Areas without Fine Ground Truth

Zimin Xia, Yujiao Shi, HONGDONG LI et al.

ECCV 2024arXiv:2407.16826

#5629

SINDER: Repairing the Singular Defects of DINOv2

Haoqi Wang, Tong Zhang, Mathieu Salzmann

ICML 2024oralarXiv:2309.10852

#5630

Using AI Uncertainty Quantification to Improve Human Decision-Making

Laura Marusich, Jonathan Bakdash, Yan Zhou et al.

AAAI 2024paperarXiv:2312.07922

#5631

Memory-Efficient Reversible Spiking Neural Networks

Hong Zhang, Yu Zhang

ICML 2024spotlightarXiv:2402.13725

#5632

Sparse and Structured Hopfield Networks

Saúl Santos, Vlad Niculae, Daniel McNamee et al.

ICLR 2024arXiv:2404.17951

#5633

Cauchy-Schwarz Divergence Information Bottleneck for Regression

Shujian Yu, Xi Yu, Sigurd Løkse et al.

ECCV 2024arXiv:2501.01681

#5634

SNeRV: Spectra-preserving Neural Representation for Video

Jina Kim, Jihoo Lee, Jewon Kang

ICLR 2024arXiv:2309.17182

#5635

RECOMBINER: Robust and Enhanced Compression with Bayesian Implicit Neural Representations

Jiajun He, Gergely Flamich, Zongyu Guo et al.

#5636

Robust Test-Time Adaptation for Zero-Shot Prompt Tuning

Ding-Chu Zhang, Zhi Zhou, Yufeng Li

CVPR 2024arXiv:2404.01925

#5637

Improving Bird's Eye View Semantic Segmentation by Task Decomposition

Tianhao Zhao, Yongcan Chen, Yu Wu et al.

CVPR 2024highlightarXiv:2312.02149

#5638

Generative Powers of Ten

Xiaojuan Wang, Janne Kontkanen, Brian Curless et al.

AAAI 2024paperarXiv:2312.13008

#5639

No More Shortcuts: Realizing the Potential of Temporal Self-Supervision

Ishan Rajendrakumar Dave, Simon Jenni, Mubarak Shah

CVPR 2024arXiv:2402.18133

#5640

Classes Are Not Equal: An Empirical Study on Image Recognition Fairness

Jiequan Cui, Beier Zhu, Xin Wen et al.

ECCV 2024arXiv:2407.19497

#5641

Skeleton-based Group Activity Recognition via Spatial-Temporal Panoramic Graph

Zhengcen Li, Xinle Chang, Yueran Li et al.

AAAI 2024paperarXiv:2403.05406

#5642

Considering Nonstationary within Multivariate Time Series with Variational Hierarchical Transformer for Forecasting

Muyao Wang, Wenchao Chen, Bo Chen

ECCV 2024arXiv:2408.16478

#5643

MICDrop: Masking Image and Depth Features via Complementary Dropout for Domain-Adaptive Semantic Segmentation

Linyan Yang, Lukas Hoyer, Mark Weber et al.

ICML 2024arXiv:2405.12607

#5644

S3O: A Dual-Phase Approach for Reconstructing Dynamic Shape and Skeleton of Articulated Objects from Single Monocular Video

Hao Zhang, Fang Li, Samyak Rawlekar et al.

ECCV 2024arXiv:2409.15269

#5645

ReLoo: Reconstructing Humans Dressed in Loose Garments from Monocular Video in the Wild

Chen Guo, Tianjian Jiang, Manuel Kaufmann et al.

ICLR 2024arXiv:2304.00195

#5646

Abstractors and relational cross-attention: An inductive bias for explicit relational reasoning in Transformers

Awni Altabaa, Taylor Webb, Jonathan Cohen et al.

ICLR 2024spotlightarXiv:2305.14486

#5647

Point2SSM: Learning Morphological Variations of Anatomies from Point Clouds

Jadie Adams, Shireen Elhabian

ICLR 2024arXiv:2311.13628

#5648

Prompt Risk Control: A Rigorous Framework for Responsible Deployment of Large Language Models

Thomas Zollo, Todd Morrill, Zhun Deng et al.

AAAI 2024paperarXiv:2401.15447

#5649

Continuous Treatment Effect Estimation Using Gradient Interpolation and Kernel Smoothing

Lokesh Nagalapatti, Akshay Iyer, Abir De et al.

ICLR 2024arXiv:2304.01665

#5650

Mastering Symbolic Operations: Augmenting Language Models with Compiled Neural Networks

Yixuan Weng, Minjun Zhu, Fei Xia et al.

ICML 2024arXiv:2402.18361

#5651

Why Do Animals Need Shaping? A Theory of Task Composition and Curriculum Learning

Jin Hwa Lee, Stefano Mannelli, Andrew Saxe

ICLR 2024arXiv:2310.01015

#5652

EX-Graph: A Pioneering Dataset Bridging Ethereum and X

Qian Wang, Zhen Zhang, Zemin Liu et al.

ECCV 2024arXiv:2409.08572

#5653

DiffFAS: Face Anti-Spoofing via Generative Diffusion Models

Xinxu Ge, Xin Liu, Zitong Yu et al.

ICLR 2024arXiv:2310.01865

#5654

Conditional Instrumental Variable Regression with Representation Learning for Causal Inference

Debo Cheng, Ziqi Xu, Jiuyong Li et al.

#5655

Learning Task-Aware Language-Image Representation for Class-Incremental Object Detection

Hongquan Zhang, Bin-Bin Gao, Yi Zeng et al.

CVPR 2024arXiv:2404.04960

#5656

PairAug: What Can Augmented Image-Text Pairs Do for Radiology?

Yutong Xie, Qi Chen, Sinuo Wang et al.

AAAI 2024paperarXiv:2312.05614

#5657

Transformer as Linear Expansion of Learngene

Shiyu Xia, Miaosen Zhang, Xu Yang et al.

ICLR 2024arXiv:2308.03449

#5658

Accurate Retraining-free Pruning for Pretrained Encoder-based Language Models

Seungcheol Park, Hojun Choi, U Kang

ICML 2024arXiv:2402.02720

#5659

Discounted Adaptive Online Learning: Towards Better Regularization

Zhiyu Zhang, David Bombara, Heng Yang

#5660

Physical-Based Event Camera Simulator

Haiqian Han, Jiacheng Lyu, Jianing Li et al.

ECCV 2024arXiv:2409.02882

#5661

Benchmarking Spurious Bias in Few-Shot Image Classifiers

Guangtao Zheng, Wenqian Ye, Aidong Zhang

ECCV 2024arXiv:2407.11950

#5662

Temporally Consistent Stereo Matching

Jiaxi Zeng, Chengtang Yao, Yuwei Wu et al.

AAAI 2024paperarXiv:2403.11803

#5663

Federated Modality-Specific Encoders and Multimodal Anchors for Personalized Brain Tumor Segmentation

#5664

Unsupervised Gaze Representation Learning from Multi-view Face Images

Yiwei Bao, Feng Lu

ICML 2024arXiv:2406.05391

#5665

DUPLEX: Dual GAT for Complex Embedding of Directed Graphs

Zhaoru Ke, Hang Yu, Jianguo Li et al.

ECCV 2024arXiv:2407.11294

#5666

COHO: Context-Sensitive City-Scale Hierarchical Urban Layout Generation

Liu He, Daniel Aliaga

CVPR 2024arXiv:2404.11987

#5667

MultiPhys: Multi-Person Physics-aware 3D Motion Estimation

Nicolás Ugrinovic, Boxiao Pan, Georgios Pavlakos et al.

ICLR 2024arXiv:2309.15257

#5668

STARC: A General Framework For Quantifying Differences Between Reward Functions

Joar Skalse, Lucy Farnik, Sumeet Motwani et al.

ICML 2024spotlightarXiv:2406.00426

#5669

InterpreTabNet: Distilling Predictive Signals from Tabular Data by Salient Feature Interpretation

Jacob Si, Wendy Yusi Cheng, Michael Cooper et al.

ECCV 2024arXiv:2407.04947

#5670

FreeCompose: Generic Zero-Shot Image Composition with Diffusion Prior

Zhekai Chen, Wen Wang, Zhen Yang et al.

AAAI 2024paperarXiv:2307.10156

#5671

Exploring Transformer Extrapolation

Zhen Qin, Yiran Zhong, Hui Deng

ICML 2024spotlightarXiv:2311.17983

#5672

Improving Interpretation Faithfulness for Vision Transformers

Lijie Hu, Yixin Liu, Ninghao Liu et al.

ICLR 2024arXiv:2404.09632

#5673

Bridging Vision and Language Spaces with Assignment Prediction

Jungin Park, Jiyoung Lee, Kwanghoon Sohn

CVPR 2024arXiv:2403.12777

#5674

Discover and Mitigate Multiple Biased Subgroups in Image Classifiers

Zeliang Zhang, Mingqian Feng, Zhiheng Li et al.

AAAI 2024paperarXiv:2312.08760

#5675

CF-NeRF: Camera Parameter Free Neural Radiance Fields with Incremental Learning

Qingsong Yan, Qiang Wang, Kaiyong Zhao et al.

ICML 2024arXiv:2402.17756

#5676

Robustly Learning Single-Index Models via Alignment Sharpness

Nikos Zarifis, Puqian Wang, Ilias Diakonikolas et al.

AAAI 2024paperarXiv:2308.06838

#5677

Weisfeiler and Lehman Go Paths: Learning Topological Features via Path Complexes

Quang Truong, Peter Chin

CVPR 2024arXiv:2404.19417

#5678

Physical Backdoor: Towards Temperature-based Backdoor Attacks in the Physical World

Wen Yin, Jian Lou, Pan Zhou et al.

ICML 2024arXiv:2312.13426

#5679

Consistent Long-Term Forecasting of Ergodic Dynamical Systems

Vladimir Kostic, Karim Lounici, Prune Inzerilli et al.

ICML 2024oralarXiv:2211.10636

#5680

EVEREST: Efficient Masked Video Autoencoder by Removing Redundant Spatiotemporal Tokens

Sunil Hwang, Jaehong Yoon, Youngwan Lee et al.

ICML 2024arXiv:2406.19298

#5681

Compositional Image Decomposition with Diffusion Models

Jocelin Su, Nan Liu, Yanbo Wang et al.

ICML 2024arXiv:2406.03671

#5682

PANDA: Expanded Width-Aware Message Passing Beyond Rewiring

Jeongwhan Choi, Sumin Parksumin, Hyowon Wi et al.

ICML 2024arXiv:2310.11558

#5683

Online Algorithms with Uncertainty-Quantified Predictions

Bo Sun, Jerry Huang, Nicolas Christianson et al.

ICML 2024arXiv:2405.14352

#5684

Explaining Graph Neural Networks via Structure-aware Interaction Index

Ngoc Bui, Trung Hieu Nguyen, Viet Anh Nguyen et al.

ICML 2024arXiv:2403.09930

#5685

Quality-Diversity Actor-Critic: Learning High-Performing and Diverse Behaviors via Value and Successor Features Critics

Luca Grillotti, Maxence Faldor, Borja G. León et al.

ICML 2024oralarXiv:2405.06263

#5686

Learning Latent Dynamic Robust Representations for World Models

Ruixiang Sun, Hongyu Zang, Xin Li et al.

ICML 2024arXiv:2403.09560

#5687

Self-Consistency Training for Density-Functional-Theory Hamiltonian Prediction

He Zhang, Chang Liu, wang et al.

ICML 2024arXiv:2404.00522

#5688

Minimum-Norm Interpolation Under Covariate Shift

Neil Mallinar, Austin Zane, Spencer Frei et al.

ICML 2024arXiv:2403.03103

#5689

Emergent Equivariance in Deep Ensembles

Jan Gerken, Pan Kessel

ICML 2024arXiv:2407.05385

#5690

Harmony in Diversity: Merging Neural Networks with Canonical Correlation Analysis

Stefan Horoi, Albert Manuel Orozco Camacho, Eugene Belilovsky et al.

ICML 2024arXiv:2404.13815

#5691

Improving Group Robustness on Spurious Correlation Requires Preciser Group Inference

Yujin Han, Difan Zou

ICML 2024arXiv:2402.08450

#5692

Subgraphormer: Unifying Subgraph GNNs and Graph Transformers via Graph Products

Guy Bar Shalom, Beatrice Bevilacqua, Haggai Maron

ICML 2024arXiv:2405.20456

#5693

Scaling Laws for the Value of Individual Data Points in Machine Learning

Ian Covert, Wenlong Ji, Tatsunori Hashimoto et al.

ICML 2024arXiv:2403.09635

#5694

Transformers Get Stable: An End-to-End Signal Propagation Theory for Language Models

Akhil Kedia, Mohd Abbas Zaidi, Sushil Khyalia et al.

ICML 2024arXiv:2405.19098

#5695

Efficient Black-box Adversarial Attacks via Bayesian Optimization Guided by a Function Prior

Shuyu Cheng, Yibo Miao, Yinpeng Dong et al.

ICML 2024arXiv:2406.08210

#5696

Expressivity and Generalization: Fragment-Biases for Molecular GNNs

Tom Wollschläger, Niklas Kemper, Leon Hetzel et al.

ICML 2024arXiv:2406.04872

#5697

Diversified Batch Selection for Training Acceleration

Feng Hong, Yueming LYU, Jiangchao Yao et al.

ICML 2024arXiv:2310.12956

#5698

Eureka-Moments in Transformers: Multi-Step Tasks Reveal Softmax Induced Optimization Problems

David T. Hoffmann, Simon Schrodi, Jelena Bratulić et al.

ICML 2024arXiv:2312.06158

#5699

Adaptive Feature Selection for No-Reference Image Quality Assessment by Mitigating Semantic Noise Sensitivity

Xudong Li, Timin Gao, Runze Hu et al.

ICML 2024arXiv:2306.02939

#5700

Improved Stability and Generalization Guarantees of the Decentralized SGD Algorithm

Batiste Le Bars, Aurélien Bellet, Marc Tommasi et al.

ICML 2024arXiv:2402.10534

#5701

Using Left and Right Brains Together: Towards Vision and Language Planning

Jun CEN, Chenfei Wu, Xiao Liu et al.

ICML 2024arXiv:2405.16805

#5702

Gradient Compressed Sensing: A Query-Efficient Gradient Estimator for High-Dimensional Zeroth-Order Optimization

Ruizhong Qiu, Hanghang Tong

ICML 2024arXiv:2405.19175

#5703

Online Linear Regression in Dynamic Environments via Discounting

Andrew Jacobsen, Ashok Cutkosky

ICML 2024spotlightarXiv:2406.13882

#5704

Allocation Requires Prediction Only if Inequality Is Low

Ali Shirali, Rediet Abebe, Moritz Hardt

ICML 2024arXiv:2210.01672

#5705

Bringing Motion Taxonomies to Continuous Domains via GPLVM on Hyperbolic manifolds

Noémie Jaquier, Leonel Rozo, Miguel González-Duque et al.

ICML 2024arXiv:2404.08602

#5706

Sliding Down the Stairs: How Correlated Latent Variables Accelerate Learning with Neural Networks

Lorenzo Bardone, Sebastian Goldt

ICML 2024arXiv:2402.05598

#5707

Neural operators meet conjugate gradients: The FCG-NO method for efficient PDE solving

Alexander Rudikov, Fanaskov Vladimir, Ekaterina Muravleva et al.

ICML 2024arXiv:2402.02098

#5708

Self-attention Networks Localize When QK-eigenspectrum Concentrates

Han Bao, Ryuichiro Hataya, Ryo Karakida

ICML 2024spotlightarXiv:2402.10036

#5709

Predictive Linear Online Tracking for Unknown Targets

Anastasios Tsiamis, Aren Karapetyan, Yueshan Li et al.

ICML 2024arXiv:2405.17880

#5710

Diffusion Rejection Sampling

Byeonghu Na, Yeongmin Kim, Minsang Park et al.

ICML 2024arXiv:2406.07224

#5711

Differentiability and Optimization of Multiparameter Persistent Homology

Luis Scoccola, Siddharth Setlur, David Loiseaux et al.

ICML 2024spotlightarXiv:2406.07145

#5712

Failures Are Fated, But Can Be Faded: Characterizing and Mitigating Unwanted Behaviors in Large-Scale Vision and Language Models

Som Sagar, Aditya Taparia, Ransalu Senanayake

ICML 2024arXiv:2406.01909

#5713

A Global Geometric Analysis of Maximal Coding Rate Reduction

Peng Wang, Huikang Liu, Druv Pai et al.

ICML 2024arXiv:2402.19232

#5714

Trained Random Forests Completely Reveal your Dataset

Julien Ferry, Ricardo Fukasawa, Timothée Pascal et al.

ECCV 2024arXiv:2404.10312

#5715

OmniSSR: Zero-shot Omnidirectional Image Super-Resolution using Stable Diffusion Model

Runyi Li, Xuhan SHENG, Weiqi Li et al.

#5716

FD3D: Exploiting Foreground Depth Map for Feature-Supervised Monocular 3D Object Detection

Zizhang Wu, Yuanzhu Gan, Yunzhe Wu et al.

AAAI 2024paperarXiv:2312.14472

#5717

Not All Tasks Are Equally Difficult: Multi-Task Deep Reinforcement Learning with Dynamic Depth Routing

Jinmin He, Kai Li, Yifan Zang et al.

AAAI 2024paperarXiv:2401.07459

#5718

Semantic Segmentation in Multiple Adverse Weather Conditions with Domain Knowledge Retention

Xin Yang, Wending Yan, Yuan Yuan et al.

#5719

Workflow Discovery from Dialogues in the Low Data Regime

David Vazquez, Stefania Raimondo, Christopher Pal et al.

ICLR 2024

ECCV 2024arXiv:2311.16445

#5720

CLAP: Isolating Content from Style through Contrastive Learning with Augmented Prompts

Yichao Cai, Yuhang Liu, Zhen Zhang et al.

ECCV 2024arXiv:2407.08569

#5721

Approaching Outside: Scaling Unsupervised 3D Object Detection from 2D Scene

Ruiyang Zhang, Hu Zhang, Hang Yu et al.

ECCV 2024arXiv:2404.11895

#5722

FreeDiff: Progressive Frequency Truncation for Image Editing with Diffusion Models

Wei WU, Qingnan Fan, Shuai Qin et al.

ICLR 2024arXiv:2309.17053

#5723

On the Power of the Weisfeiler-Leman Test for Graph Motif Parameters

Matthias Lanzinger, Pablo Barcelo

CVPR 2024arXiv:2311.17754

#5724

Cinematic Behavior Transfer via NeRF-based Differentiable Filming

Xuekun Jiang, Anyi Rao, Jingbo Wang et al.

ICML 2024arXiv:2402.16506

#5725

Stochastic Conditional Diffusion Models for Robust Semantic Image Synthesis

Juyeon Ko, Inho Kong, Dogyun Park et al.

ICML 2024arXiv:2405.18194

#5726

Delving into Differentially Private Transformer

Youlong Ding, Xueyang Wu, Yining meng et al.

ICLR 2024arXiv:2403.01112

#5727

Efficient Episodic Memory Utilization of Cooperative Multi-Agent Reinforcement Learning

Hyungho Na, Yunkyeong Seo, Il-chul Moon

CVPR 2024arXiv:2404.01998

#5728

Specularity Factorization for Low-Light Enhancement

Saurabh Saini, P. J. Narayanan

CVPR 2024arXiv:2404.04318

#5729

Robust Depth Enhancement via Polarization Prompt Fusion Tuning

Kei IKEMURA, Yiming Huang, Felix Heide et al.

AAAI 2024paperarXiv:2306.15272

#5730

Delivering Inflated Explanations

Yacine Izza, Alexey Ignatiev, Peter Stuckey et al.

AAAI 2024paperarXiv:2312.13555

#5731

CR-SAM: Curvature Regularized Sharpness-Aware Minimization

Tao Wu, Tie Luo, Donald Wunsch

ECCV 2024arXiv:2407.10937

#5732

IDOL: Unified Dual-Modal Latent Diffusion for Human-Centric Joint Video-Depth Generation

Yuanhao Zhai, Kevin Lin, Linjie Li et al.

ICML 2024spotlightarXiv:2402.10475

#5733

Fundamental Benefit of Alternating Updates in Minimax Optimization

Jaewook Lee, Hanseul Cho, Chulhee Yun

AAAI 2024paperarXiv:2401.01642

#5734

BLADE: Box-Level Supervised Amodal Segmentation through Directed Expansion

Zhaochen Liu, Zhixuan Li, Tingting Jiang

ECCV 2024arXiv:2407.10181

#5735

Multiscale Sliced Wasserstein Distances as Perceptual Color Difference Measures

Jiaqi He, Zhihua Wang, Leon Wang et al.

ECCV 2024arXiv:2407.13642

#5736

Open-Vocabulary 3D Semantic Segmentation with Text-to-Image Diffusion Models

Xiaoyu Zhu, Hao Zhou, Pengfei Xing et al.

ECCV 2024arXiv:2408.07481

#5737

DeCo: Decoupled Human-Centered Diffusion Video Editing with Motion Consistency

Xiaojing Zhong, Xinyi Huang, Xiaofeng Yang et al.

AAAI 2024paperarXiv:2401.12507

#5738

Open-Set Facial Expression Recognition

Yuhang Zhang, Yue Yao, Xuannan Liu et al.

#5739

1497 Once and for All: Universal Transferable Adversarial Perturbation against Deep Hashing-Based Facial Image Retrieval

Long Tang, Dengpan Ye, Yunna Lv et al.

#5740

TimeCraft: Navigate Weakly-Supervised Temporal Grounded Video Question Answering via Bi-directional Reasoning

Huabin Liu, Xiao Ma, Cheng Zhong et al.

AAAI 2024paperarXiv:2312.12021

#5741

Synergistic Anchored Contrastive Pre-training for Few-Shot Relation Extraction

Da Luo, Yanglei Gan, Rui Hou et al.

#5742

DeIL: Direct-and-Inverse CLIP for Open-World Few-Shot Learning

Shuai Shao, Yu Bai, Yan WANG et al.

CVPR 2024arXiv:2404.01725

#5743

Disentangled Pre-training for Human-Object Interaction Detection

Zhuolong Li, Xingao Li, Changxing Ding et al.

ECCV 2024arXiv:2409.18261

#5744

Omni6D: Large-Vocabulary 3D Object Dataset for Category-Level 6D Object Pose Estimation

Mengchen Zhang, Tong Wu, Tai Wang et al.

CVPR 2024arXiv:2309.12790

#5745

NTO3D: Neural Target Object 3D Reconstruction with Segment Anything

Xiaobao Wei, Renrui Zhang, Jiarui Wu et al.

ECCV 2024arXiv:2407.12727

#5746

NL2Contact: Natural Language Guided 3D Hand-Object Contact Modeling with Diffusion Model

Zhongqun Zhang, Hengfei Wang, Ziwei Yu et al.

CVPR 2024arXiv:2404.04624

#5747

Bridging the Gap Between End-to-End and Two-Step Text Spotting

Mingxin Huang, Hongliang Li, Yuliang Liu et al.

ICML 2024arXiv:2402.11173

#5748

How to Make the Gradients Small Privately: Improved Rates for Differentially Private Non-Convex Optimization

Andrew Lowy, Jonathan Ullman, Stephen Wright

AAAI 2024paperarXiv:2308.02223

#5749

ESRL: Efficient Sampling-Based Reinforcement Learning for Sequence Generation

Chenglong Wang, Hang Zhou, Yimin Hu et al.

#5750

JointSQ: Joint Sparsification-Quantization for Distributed Learning

Weiying Xie, Haowei Li, Ma Jitao et al.

ECCV 2024arXiv:2403.15033

#5751

Toward Tiny and High-quality Facial Makeup with Data Amplify Learning

Qiaoqiao Jin, Xuanhong Chen, Meiguang Jin et al.

AAAI 2024paperarXiv:2312.16409

#5752

Dynamic Sub-graph Distillation for Robust Semi-supervised Continual Learning

Yan Fan, Yu Wang, Pengfei Zhu et al.

ICML 2024arXiv:2412.11499

#5753

Embodied CoT Distillation From LLM To Off-the-shelf Agents

Wonje Choi, Woo Kyung Kim, Minjong Yoo et al.

ECCV 2024arXiv:2409.17988

#5754

Deblur e-NeRF: NeRF from Motion-Blurred Events under High-speed or Low-light Conditions

Weng Fei Low, Gim Hee Lee

CVPR 2024arXiv:2312.00210

#5755

DREAM: Diffusion Rectification and Estimation-Adaptive Models

Jinxin Zhou, Tianyu Ding, Tianyi Chen et al.

ICLR 2024arXiv:2404.08828

#5756

Hindsight PRIORs for Reward Learning from Human Preferences

Mudit Verma, Katherine Metcalf

ICLR 2024spotlightarXiv:2309.00359

#5757

Large Content And Behavior Models To Understand, Simulate, And Optimize Content And Behavior

Ashmit Khandelwal, Aditya Agrawal, Aanisha Bhattacharyya et al.

ECCV 2024arXiv:2403.04398

#5758

MAGR: Manifold-Aligned Graph Regularization for Continual Action Quality Assessment

Kanglei Zhou, Liyuan Wang, Xingxing Zhang et al.

CVPR 2024arXiv:2404.05426

#5759

Test-Time Zero-Shot Temporal Action Localization

Benedetta Liberatori, Alessandro Conti, Paolo Rota et al.

ECCV 2024arXiv:2311.15510

#5760

CaesarNeRF: Calibrated Semantic Representation for Few-Shot Generalizable Neural Rendering

Haidong Zhu, Tianyu Ding, Tianyi Chen et al.

ICML 2024arXiv:2406.04596

#5761

Federated Representation Learning in the Under-Parameterized Regime

Renpu Liu, Cong Shen, Jing Yang

ICLR 2024arXiv:2310.01777

#5762

SEA: Sparse Linear Attention with Estimated Attention Mask

Heejun Lee, Jina Kim, Jeff Willette et al.

ECCV 2024arXiv:2407.09012

#5763

TCAN: Animating Human Images with Temporally Consistent Pose Guidance using Diffusion Models

Jeongho Kim, Min-Jung Kim, Junsoo Lee et al.

ICLR 2024arXiv:2310.08287

#5764

A Symmetry-Aware Exploration of Bayesian Neural Network Posteriors

Olivier Laurent, Emanuel Aldea, Gianni Franchi

ICML 2024arXiv:2405.04858

#5765

Pedestrian Attribute Recognition as Label-balanced Multi-label Learning

Yibo Zhou, Hai-Miao Hu, Yirong Xiang et al.

CVPR 2024arXiv:2312.09250

#5766

Single Mesh Diffusion Models with Field Latents for Texture Generation

Thomas W. Mitchel, Carlos Esteves, Ameesh Makadia

ICML 2024oralarXiv:2405.02670

#5767

From Generalization Analysis to Optimization Designs for State Space Models

Fusheng Liu, Qianxiao Li

#5768

Dynamic Layer Tying for Parameter-Efficient Transformers

Tamir David-Hay, Lior Wolf

ICLR 2024

ICLR 2024arXiv:2306.03013

#5769

Hiding in Plain Sight: Disguising Data Stealing Attacks in Federated Learning

Kostadin Garov, Dimitar I. Dimitrov, Nikola Jovanović et al.

ICLR 2024arXiv:2305.19306

#5770

A Graph is Worth 1-bit Spikes: When Graph Contrastive Learning Meets Spiking Neural Networks

Jintang Li, Huizhe Zhang, Ruofan Wu et al.

ECCV 2024arXiv:2407.09919

#5771

Arbitrary-Scale Video Super-Resolution with Structural and Textural Priors

Wei Shang, Dongwei Ren, Wanying Zhang et al.

ICLR 2024oralarXiv:2306.09085

#5772

COSA: Concatenated Sample Pretrained Vision-Language Foundation Model

Sihan Chen, Xingjian He, Handong Li et al.

AAAI 2024paperarXiv:2312.09486

#5773

Unraveling Batch Normalization for Realistic Test-Time Adaptation

Zixian Su, Jingwei Guo, Kai Yao et al.

ECCV 2024arXiv:2403.11503

#5774

Diffusion Models are Geometry Critics: Single Image 3D Editing Using Pre-Trained Diffusion Priors

Ruicheng Wang, Jianfeng Xiang, Jiaolong Yang et al.

ICML 2024arXiv:2302.10796

#5775

Provably Efficient Exploration in Quantum Reinforcement Learning with Logarithmic Worst-Case Regret

Han Zhong, Jiachen Hu, Yecheng Xue et al.

AAAI 2024paperarXiv:2401.09146

#5776

Continuous Piecewise-Affine Based Motion Model for Image Animation

Hexiang Wang, Fengqi Liu, Qianyu Zhou et al.

#5777

Class-Agnostic Object Counting with Text-to-Image Diffusion Model

Xiaofei Hui, Qian Wu, Hossein Rahmani et al.

#5778

TF-FAS: Twofold-Element Fine-Grained Semantic Guidance for Generalizable Face Anti-Spoofing

Xudong Wang, Ke-Yue Zhang, Taiping Yao et al.

CVPR 2024arXiv:2401.01647

#5779

SIGNeRF: Scene Integrated Generation for Neural Radiance Fields

Jan-Niklas Dihlmann, Andreas Engelhardt, Hendrik Lensch

AAAI 2024paperarXiv:2401.01484

#5780

Uncertainty Regularized Evidential Regression

Kai Ye, Tiejin Chen, Hua Wei et al.

#5781

Towards Understanding and Improving Adversarial Robustness of Vision Transformers

Samyak Jain, Tanima Dutta

ICLR 2024arXiv:2402.13241

#5782

Federated Causal Discovery from Heterogeneous Data

Loka Li, Ignavier Ng, Gongxu Luo et al.

AAAI 2024paperarXiv:2402.18201

#5783

Learning Invariant Inter-pixel Correlations for Superpixel Generation

Sen Xu, Shikui Wei, Tao Ruan et al.

ECCV 2024arXiv:2404.08327

#5784

Salience-Based Adaptive Masking: Revisiting Token Dynamics for Enhanced Pre-training

Hyesong Choi, Hyejin Park, Kwang Moo Yi et al.

#5785

Bi-Causal: Group Activity Recognition via Bidirectional Causality

Youliang Zhang, Wenxuan Liu, danni xu et al.

AAAI 2024paperarXiv:2401.17527

#5786

Learning to Stop Cut Generation for Efficient Mixed-Integer Linear Programming

Haotian Ling, Zhihai Wang, Jie Wang

ICLR 2024spotlightarXiv:2308.12221

#5787

Critical Learning Periods Emerge Even in Deep Linear Networks

Michael Kleinman, Alessandro Achille, Stefano Soatto

ICLR 2024arXiv:2307.06175

#5788

Learning Decentralized Partially Observable Mean Field Control for Artificial Collective Behavior

Kai Cui, Sascha Hauck, Christian Fabian et al.

ICLR 2024arXiv:2311.02826

#5789

InstructPix2NeRF: Instructed 3D Portrait Editing from a Single Image

Jianhui Li, Shilong Liu, Zidong Liu et al.

ECCV 2024arXiv:2409.10473

#5790

MacDiff: Unified Skeleton Modeling with Masked Conditional Diffusion

Lehong Wu, Lilang Lin, Jiahang Zhang et al.

ECCV 2024arXiv:2408.16236

#5791

Neural Spectral Decomposition for Dataset Distillation

Yang Shaolei, Shen Cheng, Mingbo Hong et al.

ECCV 2024arXiv:2407.08133

#5792

Nonverbal Interaction Detection

Jianan Wei, Tianfei Zhou, Yi Yang et al.

CVPR 2024arXiv:2404.01156

#5793

SyncMask: Synchronized Attentional Masking for Fashion-centric Vision-Language Pretraining

Chull Hwan Song, Taebaek Hwang, Jooyoung Yoon et al.

ECCV 2024arXiv:2407.21654

#5794

MTA-CLIP: Language-Guided Semantic Segmentation with Mask-Text Alignment

Anurag Das, Xinting Hu, Li Jiang et al.

ICLR 2024arXiv:2305.15850

#5795

Stochastic Modified Equations and Dynamics of Dropout Algorithm

Zhongwang Zhang, Yuqing Li, Tao Luo et al.

#5796

Knowledge-Aware Parameter Coaching for Personalized Federated Learning

Mingjian Zhi, Yuanguo Bi, Wenchao Xu et al.

ICLR 2024spotlightarXiv:2310.07855

#5797

CrIBo: Self-Supervised Learning via Cross-Image Object-Level Bootstrapping

Tim Lebailly, Thomas Stegmüller, Behzad Bozorgtabar et al.

ICLR 2024arXiv:2304.10523

#5798

GenCorres: Consistent Shape Matching via Coupled Implicit-Explicit Shape Generative Models

Haitao Yang, Xiangru Huang, Bo Sun et al.

CVPR 2024arXiv:2403.03037

#5799

A Backpack Full of Skills: Egocentric Video Understanding with Diverse Task Perspectives

Simone Alberto Peirone, Francesca Pistilli, Antonio Alliegro et al.

AAAI 2024paperarXiv:2312.07378

#5800

X4D-SceneFormer: Enhanced Scene Understanding on 4D Point Cloud Videos through Cross-Modal Knowledge Transfer

Linglin Jing, Ying Xue, Xu Yan et al.