Most Cited 2025 &quot;universal inverted bottleneck&quot; Papers

ICLR 2025arXiv:2410.15433

#5402

Discriminating image representations with principal distortions

Jenelle Feather, David Lipshutz, Sarah Harvey et al.

ICML 2025arXiv:2410.04959

#5403

Collapse-Proof Non-Contrastive Self-Supervised Learning

EMANUELE SANSONE, Tim Lebailly, Tinne Tuytelaars

ICLR 2025arXiv:2411.19671

#5404

On the Performance Analysis of Momentum Method: A Frequency Domain Perspective

Xianliang Li, Jun Luo, Zhiwei Zheng et al.

ICML 2025spotlightarXiv:2412.04140

#5405

Understanding and Mitigating Memorization in Generative Models via Sharpness of Probability Landscapes

Dongjae Jeon, Dueun Kim, Albert No

#5406

TRACE Back from the Future: A Probabilistic Reasoning Approach to Controllable Language Generation

Gwen Yidou-Weng, Benjie Wang, Guy Van den Broeck

ICML 2025

ICML 2025arXiv:2502.07709

#5407

MAGELLAN: Metacognitive predictions of learning progress guide autotelic LLM agents in large goal spaces

Loris Gaven, Thomas Carta, Clément Romac et al.

ICML 2025arXiv:2502.00620

#5408

Representations Shape Weak-to-Strong Generalization: Theoretical Insights and Empirical Predictions

Yihao Xue, Jiping Li, Baharan Mirzasoleiman

NEURIPS 2025arXiv:2503.19331

#5409

ChA-MAEViT: Unifying Channel-Aware Masked Autoencoders and Multi-Channel Vision Transformers for Improved Cross-Channel Learning

Chau Pham, Juan C. Caicedo, Bryan Plummer

ICML 2025arXiv:2404.02113

#5410

Position: Lifetime tuning is incompatible with continual reinforcement learning

Golnaz Mesbahi, Parham Mohammad Panahi, Olya Mastikhina et al.

ICLR 2025arXiv:2210.13455

#5411

Epistemic Monte Carlo Tree Search

Yaniv Oren, Viliam Vadocz, Matthijs T. J. Spaan et al.

ICML 2025arXiv:2406.02300

#5412

Point-Level Topological Representation Learning on Point Clouds

Vincent P. Grande, Michael Schaub

#5413

ParaSolver: A Hierarchical Parallel Integral Solver for Diffusion Models

Jianrong Lu, Zhiyu Zhu, Junhui Hou

#5414

GridMix: Exploring Spatial Modulation for Neural Fields in PDE Modeling

Honghui Wang, Shiji Song, Gao Huang

ICML 2025arXiv:2502.13870

#5415

SPEX: Scaling Feature Interaction Explanations for LLMs

Justin S. Kang, Landon Butler, Abhineet Agarwal et al.

ICML 2025spotlightarXiv:2506.06873

#5416

Log-Sum-Exponential Estimator for Off-Policy Evaluation and Learning

Armin Behnamnia, Gholamali Aminian, Alireza Aghaei et al.

ICML 2025arXiv:2501.19105

#5417

Relating Misfit to Gain in Weak-to-Strong Generalization Beyond the Squared Loss

Abhijeet Mulgund, Chirag Pabbaraju

ICLR 2025arXiv:2405.16104

#5418

Global Well-posedness and Convergence Analysis of Score-based Generative Models via Sharp Lipschitz Estimates

Connor Mooney, Zhongjian Wang, Jack Xin et al.

ICLR 2025arXiv:2504.01521

#5419

Domain Guidance: A Simple Transfer Approach for a Pre-trained Diffusion Model

Jincheng Zhong, XiangCheng Zhang, Jianmin Wang et al.

ICLR 2025arXiv:2410.02942

#5420

SymmetricDiffusers: Learning Discrete Diffusion on Finite Symmetric Groups

Yongxing Zhang, Donglin Yang, Renjie Liao

ICLR 2025oralarXiv:2411.15014

#5421

On the Linear Speedup of Personalized Federated Reinforcement Learning with Shared Representations

GUOJUN XIONG, Shufan Wang, Daniel Jiang et al.

ICLR 2025arXiv:2410.18868

#5422

A Riemannian Framework for Learning Reduced-order Lagrangian Dynamics

Katharina Friedl, Noémie Jaquier, Jens Lundell et al.

ICLR 2025arXiv:2509.08058

#5423

How Far Are We from True Unlearnability?

Kai Ye, Liangcai Su, Chenxiong Qian

ICLR 2025arXiv:2502.18538

#5424

Revisiting Convolution Architecture in the Realm of DNA Foundation Models

Yu Bo, Weian Mao, Daniel Shao et al.

ICLR 2025arXiv:2410.14672

#5425

BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities

Shaozhe Hao, Xuantong LIU, Xianbiao Qi et al.

ICML 2025arXiv:2502.15145

#5426

Projection Optimization: A General Framework for Multi-Objective and Multi-Group RLHF

Nuoya Xiong, Aarti Singh

#5427

Bridging the Semantic Gap Between Text and Table: A Case Study on NL2SQL

Lin Long, Xijun Gu, Xinjie Sun et al.

ICLR 2025arXiv:2410.13864

#5428

UniDrive: Towards Universal Driving Perception Across Camera Configurations

Ye Li, Wenzhao Zheng, Xiaonan Huang et al.

ICML 2025oralarXiv:2505.07796

#5429

Learning Dynamics in Continual Pre-Training for Large Language Models

Xingjin Wang, Howe Tissue, Lu Wang et al.

#5430

High-Dimensional Bayesian Optimisation with Gaussian Process Prior Variational Autoencoders

Siddharth Ramchandran, Manuel Haussmann, Harri Lähdesmäki

ICLR 2025oralarXiv:2401.00766

#5431

Exposure Bracketing Is All You Need For A High-Quality Image

Zhilu Zhang, Shuohao Zhang, Renlong Wu et al.

NEURIPS 2025spotlightarXiv:2412.00661

#5432

Mean-Field Sampling for Cooperative Multi-Agent Reinforcement Learning

Emile Anand, Ishani Karmarkar, Guannan Qu

ICLR 2025arXiv:2410.06232

#5433

Range, not Independence, Drives Modularity in Biologically Inspired Representations

Will Dorrell, Kyle Hsu, Luke Hollingsworth et al.

ICLR 2025arXiv:2406.06984

#5434

On the Hölder Stability of Multiset and Graph Neural Networks

Yair Davidson, Nadav Dym

ICLR 2025oralarXiv:2405.18416

#5435

3D StreetUnveiler with Semantic-aware 2DGS - a simple baseline

Jingwei Xu, Yikai Wang, Yiqun Zhao et al.

ICML 2025arXiv:2501.18901

#5436

Lightspeed Geometric Dataset Distance via Sliced Optimal Transport

Khai Nguyen, Hai Nguyen, Tuan Pham et al.

ICML 2025arXiv:2505.24378

#5437

Mastering Massive Multi-Task Reinforcement Learning via Mixture-of-Expert Decision Transformer

Yilun Kong, Guozheng Ma, Qi Zhao et al.

ICLR 2025arXiv:2410.03893

#5438

Human-Aligned Chess With a Bit of Search

Yiming Zhang, Athul Jacob, Vivian Lai et al.

ICLR 2025arXiv:2411.07249

#5439

SPDIM: Source-Free Unsupervised Conditional and Label Shift Adaptation in EEG

Shanglin Li, Motoaki Kawanabe, Reinmar Kobler

ICLR 2025oralarXiv:2411.01212

#5440

Infinite-Resolution Integral Noise Warping for Diffusion Models

Yitong Deng, Winnie Lin, Lingxiao Li et al.

ICLR 2025arXiv:2502.16779

#5441

Unposed Sparse Views Room Layout Reconstruction in the Age of Pretrain Model

Yaxuan Huang, Xili Dai, Jianan Wang et al.

ICLR 2025arXiv:2406.11608

#5442

Visually Consistent Hierarchical Image Classification

Seulki Park, Youren Zhang, Stella Yu et al.

ICLR 2025arXiv:2410.08631

#5443

CryoFM: A Flow-based Foundation Model for Cryo-EM Densities

Yi Zhou, Yilai Li, Jing Yuan et al.

ICLR 2025arXiv:2502.19718

#5444

Learning Mask Invariant Mutual Information for Masked Image Modeling

Tao Huang, Yanxiang Ma, Shan You et al.

#5445

CARTS: Advancing Neural Theorem Proving with Diversified Tactic Calibration and Bias-Resistant Tree Search

Xiao-Wen Yang, Zhi Zhou, Haiming Wang et al.

ICLR 2025arXiv:2505.08238

#5446

Motion Control of High-Dimensional Musculoskeletal Systems with Hierarchical Model-Based Planning

Yunyue Wei, Shanning Zhuang, Vincent Zhuang et al.

ICLR 2025arXiv:2505.00031

#5447

Learning to Plan Before Answering: Self-Teaching LLMs to Learn Abstract Plans for Problem Solving

Jin Zhang, Flood Sung, Zhilin Yang et al.

ICLR 2025arXiv:2503.13500

#5448

Long-horizon Visual Instruction Generation with Logic and Attribute Self-reflection

Yucheng Suo, Fan Ma, Kaixin Shen et al.

ICLR 2025arXiv:2410.11711

#5449

Zero-shot Model-based Reinforcement Learning using Large Language Models

Abdelhakim Benechehab, Youssef Attia El Hili, Ambroise Odonnat et al.

ICLR 2025arXiv:2502.14604

#5450

Noisy Test-Time Adaptation in Vision-Language Models

Chentao Cao, Zhun Zhong, (Andrew) Zhanke Zhou et al.

ICML 2025spotlightarXiv:2505.22560

#5451

Geometric Hyena Networks for Large-scale Equivariant Learning

Artem Moskalev, Mangal Prakash, Junjie Xu et al.

NEURIPS 2025arXiv:2510.08279

#5452

Learning Neural Exposure Fields for View Synthesis

Michael Niemeyer, Fabian Manhardt, Marie-Julie Rakotosaona et al.

NEURIPS 2025arXiv:2502.13257

#5453

Random Forest Autoencoders for Guided Representation Learning

Adrien Aumon, Shuang Ni, Myriam Lizotte et al.

ICLR 2025arXiv:2402.05569

#5454

Training-Free Message Passing for Learning on Hypergraphs

Bohan Tang, Zexi Liu, Keyue Jiang et al.

ICML 2025arXiv:2506.11550

#5455

Improving Multimodal Learning Balance and Sufficiency through Data Remixing

Xiaoyu Ma, Hao Chen, Yongjian Deng

ICLR 2025arXiv:2407.10484

#5456

Understanding Matrix Function Normalizations in Covariance Pooling through the Lens of Riemannian Geometry

Ziheng Chen, Yue Song, Xiaojun Wu et al.

ICML 2025oralarXiv:2409.20067

#5457

Breaking the Curse of Multiagency in Robust Multi-Agent Reinforcement Learning

Laixi Shi, Jingchu Gai, Eric Mazumdar et al.

ICLR 2025arXiv:2409.04901

#5458

Unlocking the Potential of Model Calibration in Federated Learning

Yun-Wei Chu, Dong-Jun Han, Seyyedali Hosseinalipour et al.

ICLR 2025arXiv:2406.05641

#5459

PaRa: Personalizing Text-to-Image Diffusion via Parameter Rank Reduction

Shangyu Chen, Zizheng Pan, Jianfei Cai et al.

ICLR 2025arXiv:2411.01856

#5460

MeToken: Uniform Micro-environment Token Boosts Post-Translational Modification Prediction

Cheng Tan, Zhenxiao Cao, Zhangyang Gao et al.

ICLR 2025arXiv:2403.01570

#5461

Small Models are LLM Knowledge Triggers for Medical Tabular Prediction

Jiahuan Yan, Jintai Chen, Chaowen Hu et al.

ICLR 2025arXiv:2410.07972

#5462

Learning Equivariant Non-Local Electron Density Functionals

Nicholas Gao, Eike Eberhard, Stephan Günnemann

ICLR 2025arXiv:2501.18563

#5463

No Equations Needed: Learning System Dynamics Without Relying on Closed-Form ODEs

Krzysztof Kacprzyk, Mihaela van der Schaar

ICML 2025arXiv:2506.18340

#5464

Controlled Generation with Equivariant Variational Flow Matching

Floor Eijkelboom, Heiko Zimmermann, Sharvaree Vadgama et al.

ICLR 2025arXiv:2506.02612

#5465

Simple, Good, Fast: Self-Supervised World Models Free of Baggage

Jan Robine, Marc Höftmann, Stefan Harmeling

ICLR 2025arXiv:2501.17325

#5466

Connecting Federated ADMM to Bayes

Siddharth Swaroop, Mohammad Emtiyaz Khan, Finale Doshi-Velez

NEURIPS 2025arXiv:2509.20383

#5467

MARS: A Malignity-Aware Backdoor Defense in Federated Learning

Wei Wan, Ning Yuxuan, Zhicong Huang et al.

NEURIPS 2025arXiv:2505.16836

#5468

Fact-R1: Towards Explainable Video Misinformation Detection with Deep Reasoning

Fanrui Zhang, Dian Li, Qiang Zhang et al.

ICLR 2025arXiv:2505.20029

#5469

Correlating instruction-tuning (in multimodal models) with vision-language processing (in the brain)

SUBBA REDDY OOTA, Akshett Rai Jindal, Ishani Mondal et al.

#5470

Spectral Convolutional Conditional Neural Process

Peiman Mohseni, Nick Duffield

NEURIPS 2025

NEURIPS 2025arXiv:2505.17293

#5471

Graph Data Selection for Domain Adaptation: A Model-Free Approach

Ting-Wei Li, Ruizhong Qiu, Hanghang Tong

#5472

Extreme Risk Mitigation in Reinforcement Learning using Extreme Value Theory

Jan Drgona, Mahantesh Halappanavar, Frank Liu et al.

ICLR 2025arXiv:2412.06619

#5473

Copyright-Protected Language Generation via Adaptive Model Fusion

Javier Abad, Konstantin Donhauser, Francesco Pinto et al.

ICLR 2025arXiv:2412.04318

#5474

The Hyperfitting Phenomenon: Sharpening and Stabilizing LLMs for Open-Ended Text Generation

Fredrik Carlsson, Fangyu Liu, Daniel Ward et al.

NEURIPS 2025arXiv:2507.02834

#5475

ExPO: Unlocking Hard Reasoning with Self-Explanation-Guided Reinforcement Learning

Ruiyang Zhou, Shuozhe Li, Amy Zhang et al.

ICLR 2025arXiv:2503.00733

#5476

UniWav: Towards Unified Pre-training for Speech Representation Learning and Generation

Alexander Liu, Sang-gil Lee, Chao-Han Huck Yang et al.

ICML 2025oralarXiv:2502.00921

#5477

Blink of an eye: a simple theory for feature localization in generative models

Marvin Li, Aayush Karan, Sitan Chen

ICML 2025arXiv:2503.16163

#5478

SpeCache: Speculative Key-Value Caching for Efficient Generation of LLMs

Shibo Jie, Yehui Tang, Kai Han et al.

ICML 2025arXiv:2506.13406

#5479

CALM: Consensus-Aware Localized Merging for Multi-Task Learning

Kunda Yan, Min Zhang, Sen Cui et al.

ICLR 2025arXiv:2503.00828

#5480

Training-Free Dataset Pruning for Instance Segmentation

Yalun Dai, Lingao Xiao, Ivor Tsang et al.

ICML 2025arXiv:2502.18284

#5481

Nested Expectations with Kernel Quadrature

Zonghao Chen, Masha Naslidnyk, Francois-Xavier Briol

ICLR 2025arXiv:2409.16453

#5482

Extending Mercer's expansion to indefinite and asymmetric kernels

Sungwoo Jeong, Alex Townsend

ICLR 2025arXiv:2411.02275

#5483

Breaking the Reclustering Barrier in Centroid-based Deep Clustering

Lukas Miklautz, Timo Klein, Kevin Sidak et al.

ICLR 2025arXiv:2410.09568

#5484

Second-Order Min-Max Optimization with Lazy Hessians

Lesi Chen, Chengchang Liu, Jingzhao Zhang

ICLR 2025arXiv:2405.18780

#5485

Certifying Counterfactual Bias in LLMs

Isha Chaudhary, Qian Hu, Manoj Kumar et al.

ICLR 2025arXiv:2407.18422

#5486

A Black Swan Hypothesis: The Role of Human Irrationality in AI Safety

Hyunin Lee, Chanwoo Park, David Abel et al.

ICLR 2025arXiv:2409.05358

#5487

BAMDP Shaping: a Unified Framework for Intrinsic Motivation and Reward Shaping

Aly Lidayan, Michael Dennis, Stuart Russell

#5488

Controllable Blur Data Augmentation Using 3D-Aware Motion Estimation

Insoo Kim, Hana Lee, Hyong-Euk Lee et al.

ICLR 2025oralarXiv:2410.14673

#5489

Self-supervised contrastive learning performs non-linear system identification

Rodrigo Gonzalez Laiz, Tobias Schmidt, Steffen Schneider

AAAI 2025paperarXiv:2412.16233

#5490

WiFi CSI Based Temporal Activity Detection via Dual Pyramid Network

Zhendong Liu, Le Zhang, Bing Li et al.

AAAI 2025paperarXiv:2502.07786

#5491

Counterexample Guided Program Repair Using Zero-Shot Learning and MaxSAT-based Fault Localization

Pedro Orvalho, Mikoláš Janota, Vasco M. Manquinho

ICML 2025arXiv:2502.15215

#5492

Tensor Product Neural Networks for Functional ANOVA Model

Seokhun Park, Insung Kong, yongchan Choi et al.

AAAI 2025paperarXiv:2412.09960

#5493

END^2: Robust Dual-Decoder Watermarking Framework Against Non-Differentiable Distortions

Nan Sun, Han Fang, Yuxing Lu et al.

AAAI 2025paperarXiv:2410.18687

#5494

ODDN: Addressing Unpaired Data Challenges in Open-World Deepfake Detection on Online Social Networks

Renshuai Tao, Manyi Le, Chuangchuang Tan et al.

ICLR 2025arXiv:2404.05579

#5495

DRoP: Distributionally Robust Data Pruning

Artem Vysogorets, Kartik Ahuja, Julia Kempe

AAAI 2025paperarXiv:2503.21127

#5496

Collaborative Evolution: Multi-Round Learning Between Large and Small Language Models for Emergent Fake News Detection

Ziyi Zhou, Xiaoming Zhang, Shenghan Tan et al.

ICLR 2025arXiv:2412.07544

#5497

Contractive Dynamical Imitation Policies for Efficient Out-of-Sample Recovery

Amin Soleimani Abyaneh, Mahrokh Boroujeni, Hsiu-Chin Lin et al.

ICML 2025oralarXiv:2410.01706

#5498

Sable: a Performant, Efficient and Scalable Sequence Model for MARL

Omayma Mahjoub, Sasha Abramowitz, Ruan de Kock et al.

ICLR 2025arXiv:2502.04730

#5499

PhyloVAE: Unsupervised Learning of Phylogenetic Trees via Variational Autoencoders

Tianyu Xie, David Harry Tyensoung Richman, Jiansi Gao et al.

ICLR 2025arXiv:2403.04847

#5500

Solving Inverse Problems with Model Mismatch using Untrained Neural Networks within Model-based Architectures

Peimeng Guan, Naveed Iqbal, Mark Davenport et al.

#5501

Understanding protein function with a multimodal retrieval-augmented foundation model

Timothy Truong Jr, Tristan Bepler

NEURIPS 2025

ICML 2025arXiv:2410.09795

#5502

WGFormer: An SE(3)-Transformer Driven by Wasserstein Gradient Flows for Molecular Ground-State Conformation Prediction

Fanmeng Wang, Minjie Cheng, Hongteng Xu

ICML 2025arXiv:2502.12631

#5503

Score-Based Diffusion Policy Compatible with Reinforcement Learning via Optimal Transport

Mingyang Sun, Pengxiang Ding, Weinan Zhang et al.

ICLR 2025arXiv:2501.15369

#5504

IFORMER: INTEGRATING CONVNET AND TRANSFORMER FOR MOBILE APPLICATION

Chuanyang Zheng

ICLR 2025arXiv:2503.00639

#5505

Synergy Between Sufficient Changes and Sparse Mixing Procedure for Disentangled Representation Learning

Zijian Li, Shunxing Fan, Yujia Zheng et al.

#5506

Affine Steerable Equivariant Layer for Canonicalization of Neural Networks

Yikang Li, Yeqing Qiu, Yuxuan Chen et al.

ICLR 2025arXiv:2503.09046

#5507

Discovering Influential Neuron Path in Vision Transformers

Yifan Wang, Yifei Liu, Yingdong Shi et al.

AAAI 2025paperarXiv:2506.07471

#5508

Ambiguity-Restrained Text-Video Representation Learning for Partially Relevant Video Retrieval

Cheol-Ho Cho, WonJun Moon, WooJin Jun et al.

AAAI 2025paperarXiv:2312.03289

#5509

Enhancing Robustness in Incremental Learning with Adversarial Training

Seungju Cho, Hongsin Lee, Changick Kim

ICML 2025arXiv:2501.19254

#5510

Linear $Q$-Learning Does Not Diverge in $L^2$: Convergence Rates to a Bounded Set

Xinyu Liu, Zixuan Xie, Shangtong Zhang

AAAI 2025paperarXiv:2408.16450

#5511

What to Preserve and What to Transfer: Faithful, Identity-Preserving Diffusion-based Hairstyle Transfer

Chaeyeon Chung, Sunghyun Park, Jeongho Kim et al.

#5512

DCSF-KD: Dynamic Channel-wise Spatial Feature Knowledge Distillation for Object Detection

Tao Dai, Yang Lin, Hang Guo et al.

AAAI 2025paperarXiv:2412.15523

#5513

InstructOCR: Instruction Boosting Scene Text Spotting

Chen Duan, Qianyi Jiang, Pei Fu et al.

ICML 2025arXiv:2502.18699

#5514

MPO: An Efficient Post-Processing Framework for Mixing Diverse Preference Alignment

Tianze Wang, Dongnan Gui, Yifan Hu et al.

ICML 2025arXiv:2407.04173

#5515

Quantifying Prediction Consistency Under Fine-tuning Multiplicity in Tabular LLMs

Faisal Hamman, Sachindra P Dissanayake, Saumitra Mishra et al.

ICLR 2025arXiv:2410.07571

#5516

How Does Vision-Language Adaptation Impact the Safety of Vision Language Models?

Seongyun Lee, Geewook Kim, Jiyeon Kim et al.

ICLR 2025arXiv:2410.11055

#5517

Varying Shades of Wrong: Aligning LLMs with Wrong Answers Only

Jihan Yao, Wenxuan Ding, Shangbin Feng et al.

AAAI 2025paperarXiv:2502.10714

#5518

Disentangle Nighttime Lens Flares: Self-supervised Generation-based Lens Flare Removal

Yuwen He, Wei Wang, Wanyu Wu et al.

#5519

HUANG: A Robust Diffusion Model-based Targeted Adversarial Attack Against Deep Hashing Retrieval

Chihan Huang, Xiaobo Shen

ICML 2025arXiv:2505.22948

#5520

Foundation Molecular Grammar: Multi-Modal Foundation Models Induce Interpretable Molecular Graph Languages

Michael Sun, Weize Yuan, Gang Liu et al.

#5521

GenDataAgent: On-the-fly Dataset Augmentation with Synthetic Data

Zhiteng Li, Lele Chen, Jerone Andrews et al.

ICML 2025arXiv:2506.06376

#5522

Enhancing Decision-Making of Large Language Models via Actor-Critic

Heng Dong, Kefei Duan, Chongjie Zhang

#5523

RRT-MVS: Recurrent Regularization Transformer for Multi-View Stereo

Jianfei Jiang, Liyong Wang, Haochen Yu et al.

AAAI 2025paperarXiv:2409.14201

#5524

LATTE: Improving Latex Recognition for Tables and Formulae with Iterative Refinement

Nan Jiang, Shanchao Liang, Chengxiao Wang et al.

AAAI 2025paperarXiv:2501.15073

#5525

SpatioTemporal Learning for Human Pose Estimation in Sparsely-Labeled Videos

Yingying Jiao, Zhigang Wang, Sifan Wu et al.

ICLR 2025arXiv:2410.18962

#5526

Where Am I and What Will I See: An Auto-Regressive Model for Spatial Localization and View Prediction

Junyi Chen, Di Huang, Weicai Ye et al.

AAAI 2025paperarXiv:2501.07688

#5527

C2PD: Continuity-Constrained Pixelwise Deformation for Guided Depth Super-Resolution

Jiahui Kang, Qing Cai, Runqing Tan et al.

#5528

HiCM²: Hierarchical Compact Memory Modeling for Dense Video Captioning

Minkuk Kim, Hyeon Bae Kim, Jinyoung Moon et al.

#5529

MHBench: Demystifying Motion Hallucination in VideoLLMs

Ming Kong, Xianzhou Zeng, Luyuan Chen et al.

ICML 2025arXiv:2410.10418

#5530

Unified Breakdown Analysis for Byzantine Robust Gossip

Renaud Gaucher, Aymeric Dieuleveut, Hadrien Hendrikx

ICLR 2025arXiv:2503.03995

#5531

Subgraph Federated Learning for Local Generalization

Sungwon Kim, Yoonho Lee, Yunhak Oh et al.

AAAI 2025paperarXiv:2504.02227

#5532

VEGAS: Towards Visually Explainable and Grounded Artificial Social Intelligence

Hao Li, Hao Fei, Zechao Hu et al.

AAAI 2025paperarXiv:2501.03074

#5533

AIF-SFDA: Autonomous Information Filter Driven Source-Free Domain Adaptation for Medical Image Segmentation

Haojin Li, Heng Li, Jianyu Chen et al.

AAAI 2025paperarXiv:2503.00928

#5534

Revisiting CAD Model Generation by Learning Raster Sketch

Pu Li, Wenhao Zhang, Jianwei Guo et al.

ICML 2025arXiv:2501.19158

#5535

A Theoretical Framework For Overfitting In Energy-based Modeling

Giovanni Catania, Aurélien Decelle, Cyril Furtlehner et al.

AAAI 2025paperarXiv:2412.09055

#5536

Hyperbolic-Constraint Point Cloud Reconstruction from Single RGB-D Images

Wenrui Li, Zhe Yang, Wei Han et al.

ICLR 2025arXiv:2504.18539

#5537

Multi-Task Corrupted Prediction for Learning Robust Audio-Visual Speech Representation

Sungnyun Kim, Sungwoo Cho, Sangmin Bae et al.

AAAI 2025paperarXiv:2412.11375

#5538

Text and Image Are Mutually Beneficial: Enhancing Training-Free Few-Shot Classification with CLIP

Yayuan Li, Jintao Guo, Lei Qi et al.

ICML 2025arXiv:2407.08250

#5539

Gradient Boosting Reinforcement Learning

Benjamin Fuhrer, Chen Tessler, Gal Dalal

ICLR 2025arXiv:2410.01322

#5540

Forte : Finding Outliers with Representation Typicality Estimation

Debargha Ganguly, Warren Morningstar, Andrew Yu et al.

ICML 2025arXiv:2406.13474

#5541

BoA: Attention-aware Post-training Quantization without Backpropagation

Junhan Kim, Ho-young Kim, Eulrang Cho et al.

AAAI 2025paperarXiv:2412.17366

#5542

FlowMamba: Learning Point Cloud Scene Flow with Global Motion Propagation

Min Lin, Gangwei Xu, Yun Wang et al.

#5543

Text to Point Cloud Localization with Multi-Level Negative Contrastive Learning

Dunqiang Liu, Shujun Huang, Wen Li et al.

#5544

SplineGS: Learning Smooth Trajectories in Gaussian Splatting for Dynamic Scene Reconstruction

Jihwan Yoon, Sangbeom Han, Jaeseok Oh et al.

ICLR 2025oral

#5545

ProtoCar: Learning 3D Vehicle Prototypes from Single-View and Unconstrained Driving Scene Images

Hongyuan Liu, Haochen Yu, Bochao Zou et al.

#5546

Bridge Diffusion Model: Bridge Chinese Text-to-Image Diffusion Model with English Communities

Shanyuan Liu, Bo Cheng, Yuhang Ma et al.

ICML 2025arXiv:2503.01584

#5547

SENSEI: Semantic Exploration Guided by Foundation Models to Learn Versatile World Models

Cansu Sancaktar, Christian Gumbsch, Andrii Zadaianchuk et al.

AAAI 2025paperarXiv:2412.19021

#5548

Relation-aware Hierarchical Prompt for Open-vocabulary Scene Graph Generation

Tao Liu, Rongjie Li, Chongyu Wang et al.

AAAI 2025paperarXiv:2408.10539

#5549

Training Matting Models Without Alpha Labels

Wenze Liu, Zixuan Ye, Hao Lu et al.

#5550

Learning Video-Conditioned Policy on Unlabelled Data with Joint Embedding Predictive Transformer

Hao Luo, Zongqing Lu

ICML 2025oralarXiv:2501.15925

#5551

Efficient Logit-based Knowledge Distillation of Deep Spiking Neural Networks for Full-Range Timestep Deployment

Chengting Yu, Xiaochen Zhao, Lei Liu et al.

#5552

Towards Generalizable Multi-Camera 3D Object Detection via Perspective Rendering

Hao Lu, Yunpeng Zhang, Guoqing Wang et al.

ICML 2025arXiv:2504.07091

#5553

AssistanceZero: Scalably Solving Assistance Games

Cassidy Laidlaw, Eli Bronstein, Timothy Guo et al.

#5554

Rethinking U-Net: Task-Adaptive Mixture of Skip Connections for Enhanced Medical Image Segmentation

Zichen Luo, Xinshan Zhu, Lan Zhang et al.

ICML 2025arXiv:2505.22869

#5555

CFP-Gen: Combinatorial Functional Protein Generation via Diffusion Language Models

Junbo Yin, Chao Zha, Wenjia He et al.

#5556

CAKE: Category Aware Knowledge Extraction for Open-Vocabulary Object Detection

Shiyuan Ma, Donglin Qian, Kai Ye et al.

ICLR 2025arXiv:2311.16086

#5557

MAST: model-agnostic sparsified training

Yury Demidovich, Grigory Malinovsky, Egor Shulgin et al.

AAAI 2025paperarXiv:2501.00752

#5558

Foreground-Covering Prototype Generation and Matching for SAM-Aided Few-Shot Segmentation

Suho Park, SuBeen Lee, Hyun Seok Seong et al.

ICLR 2025arXiv:2412.10782

#5559

ANaGRAM: A Natural Gradient Relative to Adapted Model for efficient PINNs learning

Nilo Schwencke, Cyril Furtlehner

ICML 2025arXiv:2505.22689

#5560

SlimLLM: Accurate Structured Pruning for Large Language Models

Jialong Guo, Xinghao Chen, Yehui Tang et al.

ICCV 2025arXiv:2511.06256

#5561

VLDrive: Vision-Augmented Lightweight MLLMs for Efficient Language-grounded Autonomous Driving

Ruifei Zhang, Wei Zhang, Xiao Tan et al.

NEURIPS 2025arXiv:2601.08198

#5562

Triplets Better Than Pairs: Towards Stable and Effective Self-Play Fine-Tuning for LLMs

Yibo Wang, Hai-Long Sun, Guangda Huzhang et al.

ICCV 2025arXiv:2504.06908

#5563

UKBOB: One Billion MRI Labeled Masks for Generalizable 3D Medical Image Segmentation

Emmanuelle Bourigault, Amir Jamaludin, Abdullah Hamdi

NEURIPS 2025oralarXiv:2506.00895

#5564

State-Covering Trajectory Stitching for Diffusion Planners

Kyowoon Lee, Jaesik Choi

#5565

One-Way Ticket: Time-Independent Unified Encoder for Distilling Text-to-Image Diffusion Models

Senmao Li, Lei Wang, Kai Wang et al.

CVPR 2025

CVPR 2025arXiv:2412.00952

#5566

ESCAPE: Equivariant Shape Completion via Anchor Point Encoding

Burak Bekci, Nassir Navab, Federico Tombari et al.

CVPR 2025arXiv:2503.18406

#5567

Instruct-CLIP: Improving Instruction-Guided Image Editing with Automated Data Refinement Using Contrastive Learning

Sherry X. Chen, Misha Sra, Pradeep Sen

CVPR 2025arXiv:2403.10344

#5568

ViiNeuS: Volumetric Initialization for Implicit Neural Surface Reconstruction of Urban Scenes with Limited Image Overlap

Hala Djeghim, Nathan Piasco, Moussab Bennehar et al.

CVPR 2025arXiv:2502.17435

#5569

GCC: Generative Color Constancy via Diffusing a Color Checker

Chen-Wei Chang, Cheng-De Fan, Chia-Che Chang et al.

NEURIPS 2025oralarXiv:2506.08003

#5570

Audio-Sync Video Generation with Multi-Stream Temporal Control

Shuchen Weng, Haojie Zheng, zheng chang et al.

CVPR 2025arXiv:2503.10257

#5571

AMR-Transformer: Enabling Efficient Long-range Interaction for Complex Neural Fluid Simulation

Zeyi Xu, Jinfan Liu, Kuangxu Chen et al.

NEURIPS 2025arXiv:2501.16642

#5572

FlowDAS: A Stochastic Interpolant-based Framework for Data Assimilation

Siyi Chen, Yixuan Jia, Qing Qu et al.

ICCV 2025arXiv:2507.01945

#5573

LongAnimation: Long Animation Generation with Dynamic Global-Local Memory

Nan Chen, Mengqi Huang, Yihao Meng et al.

NEURIPS 2025arXiv:2505.13732

#5574

Backward Conformal Prediction

Etienne Gauthier, Francis Bach, Michael Jordan

CVPR 2025arXiv:2504.09621

#5575

Tokenize Image Patches: Global Context Fusion for Effective Haze Removal in Large Images

Jiuchen Chen, Xinyu Yan, Qizhi Xu et al.

NEURIPS 2025spotlightarXiv:2503.19034

#5576

Color Conditional Generation with Sliced Wasserstein Guidance

Alexander Lobashev, Maria Larchenko, Dmitry Guskov

NEURIPS 2025oralarXiv:2506.11147

#5577

3D-RAD: A Comprehensive 3D Radiology Med-VQA Dataset with Multi-Temporal Analysis and Diverse Diagnostic Tasks

Xiaotang Gai, Jiaxiang Liu, Yichen Li et al.

ICCV 2025arXiv:2503.07087

#5578

iManip: Skill-Incremental Learning for Robotic Manipulation

Zexin Zheng, Jia-Feng Cai, Xiao-Ming Wu et al.

NEURIPS 2025oralarXiv:2506.09990

#5579

Chain-of-Action: Trajectory Autoregressive Modeling for Robotic Manipulation

Wenbo Zhang, Tianrun Hu, Hanbo Zhang et al.

NEURIPS 2025arXiv:2505.17190

#5580

Tropical Attention: Neural Algorithmic Reasoning for Combinatorial Algorithms

Baran Hashemi, Kurt Pasque, Chris Teska et al.

#5581

Noise-Resistant Video Anomaly Detection via RGB Error-Guided Multiscale Predictive Coding and Dynamic Memory

Han Hu, Wenli Du, Peng Liao et al.

CVPR 2025

CVPR 2025arXiv:2412.05161

#5582

DNF: Unconditional 4D Generation with Dictionary-based Neural Fields

Xinyi Zhang, Naiqi Li, Angela Dai

ICCV 2025arXiv:2504.09039

#5583

Sculpting Memory: Multi-Concept Forgetting in Diffusion Models via Dynamic Mask and Concept-Aware Optimization

Li, Yang Xiao, Jie Ji et al.

NEURIPS 2025arXiv:2502.15543

#5584

ParamMute: Suppressing Knowledge-Critical FFNs for Faithful Retrieval-Augmented Generation

Pengcheng Huang, Zhenghao Liu, Yukun Yan et al.

NEURIPS 2025oralarXiv:2505.21460

#5585

High-Dimensional Calibration from Swap Regret

Maxwell Fishelson, Noah Golowich, Mehryar Mohri et al.

NEURIPS 2025arXiv:2505.12345

#5586

UniEdit: A Unified Knowledge Editing Benchmark for Large Language Models

Qizhou Chen, Dakan Wang, Taolin Zhang et al.

ICCV 2025arXiv:2507.23734

#5587

RAGNet: Large-scale Reasoning-based Affordance Segmentation Benchmark towards General Grasping

Dongming Wu, Yanping Fu, Saike Huang et al.

ICCV 2025arXiv:2411.19921

#5588

SIMS: Simulating Stylized Human-Scene Interactions with Retrieval-Augmented Script Generation

Wenjia Wang, Liang Pan, Zhiyang Dou et al.

CVPR 2025highlightarXiv:2411.15099

#5589

Context-Aware Multimodal Pretraining

Karsten Roth, Zeynep Akata, Dima Damen et al.

ICCV 2025arXiv:2509.07647

#5590

Semantic Watermarking Reinvented: Enhancing Robustness and Generation Quality with Fourier Integrity

Sung Ju Lee, Nam Ik Cho

NEURIPS 2025arXiv:2505.20755

#5591

Uni-Instruct: One-step Diffusion Model through Unified Diffusion Divergence Instruction

Yifei Wang, Weimin Bai, colin zhang et al.

NEURIPS 2025arXiv:2506.21669

#5592

SEEA-R1: Tree-Structured Reinforcement Fine-Tuning for Self-Evolving Embodied Agents

Wanxin Tian, Shijie Zhang, Kevin Zhang et al.

NEURIPS 2025arXiv:2502.12171

#5593

GoRA: Gradient-driven Adaptive Low Rank Adaptation

haonan he, Peng Ye, Yuchen Ren et al.

NEURIPS 2025arXiv:2506.05285

#5594

RaySt3R: Predicting Novel Depth Maps for Zero-Shot Object Completion

Bardienus Duisterhof, Jan Oberst, Bowen Wen et al.

ICCV 2025arXiv:2503.09733

#5595

I2V3D: Controllable Image-to-video Generation with 3D Guidance

Zhiyuan Zhang, Dongdong Chen, Jing Liao

ICCV 2025arXiv:2507.20200

#5596

Neural Shell Texture Splatting: More Details and Fewer Primitives

Xin Zhang, Anpei Chen, Jincheng Xiong et al.

ICCV 2025arXiv:2411.08656

#5597

MikuDance: Animating Character Art with Mixed Motion Dynamics

Jiaxu Zhang, Xianfang Zeng, Xin Chen et al.

CVPR 2025arXiv:2503.23241

#5598

Geometry in Style: 3D Stylization via Surface Normal Deformation

Nam Anh Dinh, Itai Lang, Hyunwoo Kim et al.

ICCV 2025arXiv:2508.00230

#5599

Towards Higher Effective Rank in Parameter-Efficient Fine-tuning using Khatri-Rao Product

Paul Albert, Frederic Zhang, Hemanth Saratchandran et al.

NEURIPS 2025arXiv:2505.23052

#5600

RAGRouter: Learning to Route Queries to Multiple Retrieval-Augmented Language Models

Jiarui Zhang, Xiangyu Liu, Yong Hu et al.