Most Cited 2025 &quot;learning rate warmup&quot; Papers

#17802

Computation and Memory-Efficient Model Compression with Gradient Reweighting

Zhiwei Li, Yuesen Liao, Binrui Wu et al.

NEURIPS 2025spotlightarXiv:2509.19962

#17803

Learnable Sampler Distillation for Discrete Diffusion Models

Feiyang Fu, Tongxian Guo, Zhaoqiang Liu

#17804

Dynamic Siamese Expansion Framework for Improving Robustness in Online Continual Learning

Fei Ye, Yulong Zhao, Qihe Liu et al.

NEURIPS 2025arXiv:2510.24234

#17805

Sparse Optimistic Information Directed Sampling

Ludovic Schwartz, Hamish Flynn, Gergely Neu

#17806

PlanU: Large Language Model Reasoning through Planning under Uncertainty

Ziwei Deng, Mian Deng, Chenjing Liang et al.

NEURIPS 2025arXiv:2510.18442

#17807

Automated Model Discovery via Multi-modal & Multi-step Pipeline

Lee Jung-Mok, Nam Hyeon-Woo, Moon Ye-Bin et al.

NEURIPS 2025arXiv:2509.25946

#17808

Rethinking Hebbian Principle: Low-Dimensional Structural Projection for Unsupervised Learning

Shikuang Deng, Jiayuan Zhang, Yuhang Wu et al.

NEURIPS 2025arXiv:2510.14810

#17809

Mitigating Occlusions in Virtual Try-On via A Simple-Yet-Effective Mask-Free Framework

Chenghu Du, Shengwu Xiong, junyin Wang et al.

NEURIPS 2025oralarXiv:2507.06645

#17810

Quantifying Uncertainty in Error Consistency: Towards Reliable Behavioral Comparison of Classifiers

Thomas Klein, Sascha Meyen, Wieland Brendel et al.

#17811

Topology-Aware Learning of Tubular Manifolds via SE(3)-Equivariant Network on Ball B-Spline Curve

Jingxuan Wang, Zhongke Wu, Wang et al.

NEURIPS 2025arXiv:2511.13911

#17812

Uncertainty-Calibrated Prediction of Randomly-Timed Biomarker Trajectories with Conformal Bands

Vasiliki Tassopoulou, Charis Stamouli, Haochang Shou et al.

#17813

Knee-Deep in C-RASP: A Transformer Depth Hierarchy

Andy J Yang, Michaël Cadilhac, David Chiang

NEURIPS 2025oralarXiv:2506.16055

#17814

Accelerating Model-Free Optimization via Averaging of Cost Samples

Guido Carnevale, Giuseppe Notarstefano

NEURIPS 2025arXiv:2509.22793

#17815

LaViDa: A Large Diffusion Model for Vision-Language Understanding

Shufan Li, Konstantinos Kallidromitis, Hritik Bansal et al.

NEURIPS 2025spotlight

#17816

DEFT: Decompositional Efficient Fine-Tuning for Text-to-Image Models

Komal Kumar, Rao Anwer, Fahad Shahbaz Khan et al.

#17817

EgoDTM: Towards 3D-Aware Egocentric Video-Language Pretraining

Boshen Xu, Yuting Mei, liu xinbi et al.

NEURIPS 2025arXiv:2503.15470

#17818

Neural Hamiltonian Diffusions for Modeling Structured Geometric Dynamics

Sungwoo Park

NEURIPS 2025arXiv:2506.09813

#17819

Metritocracy: Representative Metrics for Lite Benchmarks

Ariel Procaccia, Ben Schiffer, Serena Wang et al.

#17820

Adversarial Graph Fusion for Incomplete Multi-view Semi-supervised Learning with Tensorial Imputation

Zhangqi Jiang, Tingjin Luo, Xu Yang et al.

NEURIPS 2025arXiv:2509.15955

#17821

ComRank: Ranking Loss for Multi-Label Complementary Label Learning

Jing-Yi Zhu, Yi Gao, Miao Xu et al.

NEURIPS 2025arXiv:2509.21930

#17822

DynaNav: Dynamic Feature and Layer Selection for Efficient Visual Navigation

Jiahui Wang, Changhao Chen

#17823

$\Delta \mathrm{Energy}$: Optimizing Energy Change During Vision-Language Alignment Improves both OOD Detection and OOD Generalization

Lin Zhu, Yifeng Yang, Xinbing Wang et al.

NEURIPS 2025arXiv:2506.16806

#17824

FOCUS: Unified Vision-Language Modeling for Interactive Editing Driven by Referential Segmentation

Fan Yang, Yousong Zhu, Xin Li et al.

#17825

What Makes a Reward Model a Good Teacher? An Optimization Perspective

Noam Razin, Zixuan Wang, Hubert Strauss et al.

NEURIPS 2025spotlightarXiv:2503.15477

#17826

Learning 3D Anisotropic Noise Distributions Improves Molecular Force Fields

Xixian Liu, Rui Jiao, ZHIYUAN LIU et al.

NEURIPS 2025arXiv:2510.22123

#17827

DSCS: Fast CPDAG-Based Verification of Collapsible Submodels in High-Dimensional Bayesian Networks

Wentao Wu, Shiyuan He, Jianhua Guo

NEURIPS 2025arXiv:2509.16865

#17828

Large Language Models as End-to-end Combinatorial Optimization Solvers

Xia Jiang, Yaoxin Wu, Minshuo Li et al.

#17829

Hypergraph-Enhanced Contrastive Learning for Multi-View Clustering with Hyper-Laplacian Regularization

Zhibin Gu, weili wang

NEURIPS 2025arXiv:2506.02651

#17830

Asymptotics of SGD in Sequence-Single Index Models and Single-Layer Attention Networks

Luca Arnaboldi, Bruno Loureiro, Ludovic Stephan et al.

#17831

Personalized Exercise Recommendation with Semantically-Grounded Knowledge Tracing

Yilmazcan Ozyurt, Tunaberk Almaci, Stefan Feuerriegel et al.

NEURIPS 2025arXiv:2507.11060

#17832

On the Sample Complexity of Differentially Private Policy Optimization

Yi He, Xingyu Zhou

NEURIPS 2025arXiv:2510.21060

#17833

Ascent Fails to Forget

Ioannis Mavrothalassitis, Pol Puigdemont, Noam Levi et al.

NEURIPS 2025arXiv:2509.26427

#17834

Generalizing Single-Frame Supervision to Event-Level Understanding for Video Anomaly Detection

Junxi Chen, Liang Li, Yunbin Tu et al.

NEURIPS 2025spotlightarXiv:2509.20745

#17835

Neptune-X: Active X-to-Maritime Generation for Universal Maritime Object Detection

Yu Guo, Shengfeng He, Yuxu Lu et al.

#17836

NoPo-Avatar: Generalizable and Animatable Avatars from Sparse Inputs without Human Poses

Jing Wen, Alex Schwing, Shenlong Wang

NEURIPS 2025arXiv:2511.16673

#17837

Breaking the Compression Ceiling: Data-Free Pipeline for Ultra-Efficient Delta Compression

Xiaohui Wang, Peng Ye, Chenyu Huang et al.

NEURIPS 2025arXiv:2505.13563

#17838

AdvEDM: Fine-grained Adversarial Attack against VLM-based Embodied Agents

Yichen Wang, Hangtao Zhang, Hewen Pan et al.

#17839

GeGS-PCR: Fast and Robust Color 3D Point Cloud Registration with Two-Stage Geometric-3DGS Fusion

Jiayi Tian, Haiduo Huang, Tian Xia et al.

#17840

Elastic Robust Unlearning of Specific Knowledge in Large Language Models

Yize Sui, Jing Ren, Wenjing Yang et al.

#17841

From Pose to Muscle: Multimodal Learning for Piano Hand Muscle Electromyography

RUOFAN LIU, YICHEN PENG, Takanori Oku et al.

#17842

End-to-End Low-Light Enhancement for Object Detection with Learned Metadata from RAWs

Xuelin Shen, Haifeng Jiao, Yitong Wang et al.

NEURIPS 2025arXiv:2502.04580

#17843

Technical Debt in In-Context Learning: Diminishing Efficiency in Long Context

Taejong Joo, Diego Klabjan

#17844

ShoeFit: A New Dataset and Dual-image-stream DiT Framework for Virtual Footwear Try-On

Yuhan Li, Zhiyu Jin, Yifan Tong et al.

#17845

A Gradient Guidance Perspective on Stepwise Preference Optimization for Diffusion Models

Joshua Tian Jin Tee, Hee Suk Yoon, Abu Hanif Muhammad Syarubany et al.

#17846

Retrieval is Not Enough: Enhancing RAG through Test-Time Critique and Optimization

Jiaqi Wei, Hao Zhou, Xiang Zhang et al.

NEURIPS 2025arXiv:2510.21267

#17847

Relieving the Over-Aggregating Effect in Graph Transformers

Junshu Sun, Wanxing Chang, Chenxue Yang et al.

#17848

Statistical Inference for Decentralized Federated Learning

Jia Gu, Songxi Chen

#17849

GMV: A Unified and Efficient Graph Multi-View Learning Framework

Qipeng zhu, Jie Chen, Jian Pu et al.

NEURIPS 2025arXiv:2501.15127

#17850

Versatile differentially private learning for general loss functions

Qilong Lu, Songxi Chen, Yumou Qiu

#17851

Constrained Linear Thompson Sampling

Aditya Gangrade, Venkatesh Saligrama

NEURIPS 2025arXiv:2503.02043

#17852

Geometric Learning with Positively Decomposable Kernels

Nathael Da Costa, Cyrus Mostajeran, Juan-Pablo Ortega et al.

NEURIPS 2025arXiv:2310.13821

#17853

RePIC: Reinforced Post-Training for Personalizing Multi-Modal Language Models

Yeongtak Oh, Dohyun Chung, Juhyeon Shin et al.

NEURIPS 2025arXiv:2506.18369

#17854

RLtools: A Fast, Portable Deep Reinforcement Learning Library for Continuous Control

Jonas Eschmann, Dario Albani, Giuseppe Loianno

NEURIPS 2025arXiv:2306.03530

#17855

On the Stability and Generalization of Meta-Learning: the Impact of Inner-Levels

Wenjun Ding, Jingling Liu, Lixing Chen et al.

NEURIPS 2025arXiv:2510.16807

#17856

Improving Model Representation and Reducing KV Cache via Skip Connections with First Value Heads

Zhoutong Wu, Yuan Zhang, Yiming Dong et al.

#17857

ICLScan: Detecting Backdoors in Black-Box Large Language Models via Targeted In-context Illumination

Xiaoyi Pang, Xuanyi Hao, Song Guo et al.

NEURIPS 2025arXiv:2510.15280

#17858

Foundation Models for Scientific Discovery: From Paradigm Enhancement to Paradigm Transition

Fan LIU, Jindong Han, Tengfei Lyu et al.

#17859

Embracing Contradiction: Theoretical Inconsistency Will Not Impede the Road of Building Responsible AI Systems

Gordon Dai, Yunze Xiao

NEURIPS 2025oralarXiv:2505.18139

#17860

NeurIPS should lead scientific consensus on AI policy

Rishi Bommasani

NEURIPS 2025oralarXiv:2510.00075

#17861

World Models Should Prioritize the Unification of Physical and Social Dynamics

Xiaoyuan Zhang, Chengdong Ma, Yizhe Huang et al.

NEURIPS 2025arXiv:2510.21219

#17862

Sample-Conditional Coverage in Split-Conformal Prediction

John Duchi

NEURIPS 2025arXiv:2505.23868

#17863

Noise-Robustness Through Noise: A Framework combining Asymmetric LoRA with Poisoning MoE

Zhaokun Wang, Jinyu Guo, Jingwen Pu et al.

#17864

Setting $\varepsilon$ is not the Issue in Differential Privacy

Edwige Cyffers

NEURIPS 2025arXiv:2511.06305

#17865

Diffusion-Classifier Synergy: Reward-Aligned Learning via Mutual Boosting Loop for FSCIL

Ruitao Wu, Yifan Zhao, Guangyao Chen et al.

NEURIPS 2025arXiv:2510.03608

#17866

S$^2$M-Former: Spiking Symmetric Mixing Branchformer for Brain Auditory Attention Detection

Jiaqi Wang, Zhengyu Ma, Xiongri Shen et al.

NEURIPS 2025arXiv:2508.05164

#17867

Prompting as Scientific Inquiry

Ari Holtzman, Chenhao Tan

NEURIPS 2025oralarXiv:2507.00163

#17868

DeepKD: A Deeply Decoupled and Denoised Knowledge Distillation Trainer

Haiduo Huang, Jiangcheng Song, Yadong Zhang et al.

NEURIPS 2025arXiv:2505.15133

#17869

The Adaptive Complexity of Minimizing Relative Fisher Information

Huanjian Zhou, Masashi Sugiyama

#17870

HPSERec: A Hierarchical Partitioning and Stepwise Enhancement Framework for Long-tailed Sequential Recommendation

Xiaolong Xu, Xudong Zhao, Haolong Xiang et al.

#17871

Accurate KV Cache Eviction via Anchor Direction Projection for Efficient LLM Inference

Zijie Geng, Jie Wang, Ziqi Liu et al.

NEURIPS 2025arXiv:2507.13348

#17872

VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

Senqiao Yang, Junyi Li, Xin Lai et al.

#17873

EF-3DGS: Event-Aided Free-Trajectory 3D Gaussian Splatting

Bohao Liao, Wei Zhai, Zengyu Wan et al.

NEURIPS 2025oralarXiv:2410.15392

#17874

A Unified Reasoning Framework for Holistic Zero-Shot Video Anomaly Analysis

Dongheng Lin, Mengxue Qu, Kunyang Han et al.

NEURIPS 2025oralarXiv:2511.00962

#17875

EPA: Boosting Event-based Video Frame Interpolation with Perceptually Aligned Learning

Yuhan Liu, LingHui Fu, Zhen Yang et al.

NEURIPS 2025arXiv:2505.15870

#17876

Satellites Reveal Mobility: A Commuting Origin-destination Flow Generator for Global Cities

Can Rong, Xin Zhang, Yanxin Xi et al.

#17877

Taccel: Scaling Up Vision-based Tactile Robotics via High-performance GPU Simulation

Yuyang Li, Wenxin Du, Chang Yu et al.

NEURIPS 2025spotlightarXiv:2504.12908

#17878

Scalable Feature Learning on Huge Knowledge Graphs for Downstream Machine Learning

Félix Lefebvre, Gael Varoquaux

NEURIPS 2025arXiv:2507.00965

#17879

How Far Are We from Optimal Reasoning Efficiency?

Jiaxuan Gao, Shu Yan, Qixin Tan et al.

NEURIPS 2025arXiv:2506.07104

#17880

Asymptotically exact variational flows via involutive MCMC kernels

Zuheng (David) Xu, Trevor Campbell

NEURIPS 2025arXiv:2506.02162

#17881

Simultaneous Statistical Inference for Off-Policy Evaluation in Reinforcement Learning

Tianpai Luo, Xinyuan Fan, Weichi Wu

#17882

Causal Discovery and Inference through Next-Token Prediction

Eivinas Butkus, Nikolaus Kriegeskorte

NEURIPS 2025oralarXiv:2510.17245

#17883

On Efficiency-Effectiveness Trade-off of Diffusion-based Recommenders

Wenyu Mao, Jiancan Wu, Guoqing Hu et al.

#17884

Covering Multiple Objectives with a Small Set of Solutions Using Bayesian Optimization

Natalie Maus, Kyurae Kim, Yimeng Zeng et al.

NEURIPS 2025arXiv:2501.19342

#17885

Can LLMs Correct Themselves? A Benchmark of Self-Correction in LLMs

Guiyao Tie, Zenghui Yuan, Zeli Zhao et al.

NEURIPS 2025arXiv:2510.16062

#17886

NTKMTL: Mitigating Task Imbalance in Multi-Task Learning from Neural Tangent Kernel Perspective

Xiaohan Qin, Xiaoxing Wang, Ning Liao et al.

NEURIPS 2025arXiv:2510.18258

#17887

UniMRSeg: Unified Modality-Relax Segmentation via Hierarchical Self-Supervised Compensation

Xiaoqi Zhao, Youwei Pang, Chenyang Yu et al.

NEURIPS 2025arXiv:2509.16170

#17888

Pragmatic Heterogeneous Collaborative Perception via Generative Communication Mechanism

Junfei Zhou, Penglin Dai, Quanmin Wei et al.

NEURIPS 2025arXiv:2510.19618

#17889

SALMONN-omni: A Standalone Speech LLM without Codec Injection for Full-duplex Conversation

Wenyi Yu, Siyin Wang, Xiaoyu Yang et al.

NEURIPS 2025arXiv:2505.17060

#17890

FRN: Fractal-Based Recursive Spectral Reconstruction Network

Ge Meng, Zhongnan Cai, Ruizhe Chen et al.

NEURIPS 2025arXiv:2505.15439

#17891

On the SAC-BL Algorithm for Anomaly Detection

Xinsong Ma, Jie Wu, Weiwei Liu

NEURIPS 2025arXiv:2505.09663

#17892

Analog Foundation Models

Julian Büchel, Iason Chalas, Giovanni Acampa et al.

#17893

L2RSI: Cross-view LiDAR-based Place Recognition for Large-scale Urban Scenes via Remote Sensing Imagery

Ziwei Shi, Xiaoran Zhang, Wenjing Xu et al.

NEURIPS 2025oralarXiv:2503.11245

#17894

Steering Information Utility in Key-Value Memory for Language Model Post-Training

Chunyuan Deng, Ruidi Chang, Hanjie Chen

NEURIPS 2025arXiv:2507.05158

#17895

Resounding Acoustic Fields with Reciprocity

Zitong Lan, Yiduo Hao, Mingmin Zhao

NEURIPS 2025arXiv:2510.20602

#17896

LithoSim: A Large, Holistic Lithography Simulation Benchmark for AI-Driven Semiconductor Manufacturing

Hongquan He, Zhen Wang, Jingya Wang et al.

NEURIPS 2025arXiv:2410.04224

#17897

Unleashing the Power of One-Step Diffusion based Image Super-Resolution via a Large-Scale Diffusion Discriminator

Jianze Li, Jiezhang Cao, Zichen Zou et al.

#17898

MMPB: It’s Time for Multi-Modal Personalization

Jaeik Kim, Woojin Kim, Woohyeon Park et al.

NEURIPS 2025arXiv:2509.22820

#17899

STAR-Bets: Sequential TArget-Recalculating Bets for Tighter Confidence Intervals

Vaclav Voracek, Francesco Orabona

NEURIPS 2025oralarXiv:2510.25173

#17900

D$^2$GS: Dense Depth Regularization for LiDAR-free Urban Scene Reconstruction

Kejing Xia, Jidong Jia, Ke Jin et al.

#17901

Flattening Hierarchies with Policy Bootstrapping

John Zhou, Jonathan Kao

NEURIPS 2025spotlightarXiv:2505.14975

#17902

Learning to Watermark: A Selective Watermarking Framework for Large Language Models via Multi-Objective Optimization

Chenrui Wang, Junyi Shu, Billy Chiu et al.

NEURIPS 2025arXiv:2510.15976

#17903

PC-Net: Weakly Supervised Compositional Moment Retrieval via Proposal-Centric Network

Mingyao Zhou, Hao Sun, Wei Xie et al.

NEURIPS 2025arXiv:2511.05935

#17904

Interaction-Centric Knowledge Infusion and Transfer for Open Vocabulary Scene Graph Generation

Lin Li, Chuhan ZHANG, Dong Zhang et al.

#17905

Local Learning for Covariate Selection in Nonparametric Causal Effect Estimation with Latent Variables

Zheng Li, Xichen Guo, Feng Xie et al.

NEURIPS 2025arXiv:2411.16315

#17906

MRO: Enhancing Reasoning in Diffusion Language Models via Multi-Reward Optimization

Chenglong Wang, Yang Gan, Hang Zhou et al.

NEURIPS 2025arXiv:2510.21473

#17907

End-to-End Vision Tokenizer Tuning

Wenxuan Wang, Fan Zhang, Yufeng Cui et al.

NEURIPS 2025arXiv:2505.10562

#17908

Gradient Descent as Loss Landscape Navigation: a Normative Framework for Deriving Learning Rules

John Vastola, Samuel J Gershman, Kanaka Rajan

NEURIPS 2025arXiv:2510.26997

#17909

Compress & Cache: Vision token compression for efficient generation and retrieval

Adrian Bulat, Yassine Ouali, Georgios Tzimiropoulos

NEURIPS 2025arXiv:2502.04799

#17910

A Regularized Newton Method for Nonconvex Optimization with Global and Local Complexity Guarantees

Yuhao Zhou, Jintao Xu, Bingrui Li et al.

#17911

Adam Reduces a Unique Form of Sharpness: Theoretical Insights Near the Minimizer Manifold

Xinghan Li, Haodong Wen, Kaifeng Lyu

NEURIPS 2025arXiv:2511.02773

#17912

Active Test-time Vision-Language Navigation

Heeju Ko, Sung June Kim, Gyeongrok Oh et al.

NEURIPS 2025arXiv:2506.06630

#17913

MoodAngels: A Retrieval-augmented Multi-agent Framework for Psychiatry Diagnosis

Mengxi Xiao, Ben Liu, He Li et al.

NEURIPS 2025arXiv:2506.03750

#17914

High Dynamic Range Imaging with Time-Encoding Spike Camera

Zhenkun Zhu, Ruiqin Xiong, Jiyu Xie et al.

#17915

OpenOmni: Advancing Open-Source Omnimodal Large Language Models with Progressive Multimodal Alignment and Real-time Emotional Speech Synthesis

Run Luo, Ting-En Lin, Haonan Zhang et al.

#17916

Adaptive Fission: Post-training Encoding for Low-latency Spike Neural Networks

Yizhou Jiang, Feng Chen, Yihan Li et al.

NEURIPS 2025arXiv:2506.02453

#17917

PAID: Pairwise Angular-Invariant Decomposition for Continual Test-Time Adaptation

Kunyu Wang, Xueyang Fu, Yuanfei Bao et al.

#17918

HermesFlow: Seamlessly Closing the Gap in Multimodal Understanding and Generation

Ling Yang, Xinchen Zhang, Ye Tian et al.

NEURIPS 2025arXiv:2502.12148

#17919

Lookahead Routing for Large Language Models

Canbin Huang, Tianyuan Shi, Yuhua Zhu et al.

NEURIPS 2025arXiv:2510.19506

#17920

Accelerating Block Coordinate Descent for LLM Finetuning via Landscape Expansion

Qijun Luo, Yifei Shen, Liangzu Peng et al.

NEURIPS 2025arXiv:2506.05551

#17921

When Semantics Mislead Vision: Mitigating Large Multimodal Models Hallucinations in Scene Text Spotting and Understanding

Yan Shu, Hangui Lin, Yexin Liu et al.

#17922

Point-MaDi: Masked Autoencoding with Diffusion for Point Cloud Pre-training

Xiaoyang Xiao, Runzhao Yao, Zhiqiang Tian et al.

#17923

Generation as Search Operator for Test-Time Scaling of Diffusion-based Combinatorial Optimization

Yang Li, Lvda Chen, Haonan Wang et al.

NEURIPS 2025oralarXiv:2512.03678

#17924

Feature-aware Modulation for Learning from Temporal Tabular Data

Haorun Cai, Han-Jia Ye

#17925

NavBench: Probing Multimodal Large Language Models for Embodied Navigation

Yanyuan Qiao, Haodong Hong, Wenqi Lyu et al.

NEURIPS 2025oralarXiv:2506.01031

#17926

STAIR: Addressing Stage Misalignment through Temporal-Aligned Preference Reinforcement Learning

Yao Luan, Ni Mu, Yiqin Yang et al.

NEURIPS 2025oralarXiv:2509.23802

#17927

Zero-Shot Detection of LLM-Generated Text via Implicit Reward Model

Runheng Liu, Heyan Huang, Xingchen Xiao et al.

NEURIPS 2025arXiv:2509.22807

#17928

MTRec: Learning to Align with User Preferences via Mental Reward Models

Mengchen Zhao, Yifan Gao, Yaqing Hou et al.

#17929

TEMPO: Temporal Multi-scale Autoregressive Generation of Protein Conformational Ensembles

Yaoyao Xu, Di Wang, Zihan Zhou et al.

NEURIPS 2025oralarXiv:2511.05510

#17930

Enhancing Contrastive Learning with Variable Similarity

Haowen Cui, Shuo Chen, Jun Li et al.

NEURIPS 2025spotlight

#17931

Unifying Reconstruction and Density Estimation via Invertible Contraction Mapping in One-Class Classification

Xiaolei Wang, Tianhong Dai, Huihui Bai et al.

NEURIPS 2025spotlightarXiv:2507.06274

#17932

Enhancing LLM Watermark Resilience Against Both Scrubbing and Spoofing Attacks

Huanming Shen, Baizhou Huang, Xiaojun Wan

#17933

Purity Law for Neural Routing Problem Solvers with Enhanced Generalizability

Wenzhao Liu, Haoran Li, Congying Han et al.

NEURIPS 2025arXiv:2502.21309

#17934

Reasoning is Periodicity? Improving Large Language Models Through Effective Periodicity Modeling

Yihong Dong, Ge Li, Xue Jiang et al.

#17935

Multi-Modal Interactive Agent Layer for Few-Shot Universal Cross-Domain Retrieval and Beyond

Kaixiang Chen, Pengfei Fang, hui xue

#17936

Price of Parsimony: Complexity of Fourier Sparsity Testing

Arijit Ghosh, Manmatha Roy

#17937

CrypticBio: A Large Multimodal Dataset for Visually Confusing Species

Georgiana Manolache, Gerard Schouten, Joaquin Vanschoren

NEURIPS 2025arXiv:2408.12798

#17938

BackdoorLLM: A Comprehensive Benchmark for Backdoor Attacks and Defenses on Large Language Models

Yige Li, Hanxun Huang, Yunhan Zhao et al.

#17939

SolidGeo: Measuring Multimodal Spatial Math Reasoning in Solid Geometry

Peijie Wang, Chao Yang, Zhong-Zhi Li et al.

NEURIPS 2025arXiv:2505.21177

#17940

InfoChartQA: A Benchmark for Multimodal Question Answering on Infographic Charts

Tianchi Xie, Minzhi Lin, Mengchen Liu et al.

NEURIPS 2025arXiv:2505.19028

#17941

Listening to the Brain: Multi-Band sEEG Auditory Reconstruction via Dynamic Spatio-Temporal Hypergraphs

Xueyi Zhang, Ruicong Wang, Jialu Sun et al.

NEURIPS 2025arXiv:2407.15026

#17942

Benchmarking End-To-End Performance of AI-Based Chip Placement Algorithms

Zhihai Wang, Zijie Geng, Zhaojie Tu et al.

#17943

GenSpace: Benchmarking Spatially-Aware Image Generation

Zehan Wang, Jiayang Xu, Ziang Zhang et al.

NEURIPS 2025arXiv:2505.24870

#17944

Rethinking Evaluation of Infrared Small Target Detection

Youwei Pang, Xiaoqi Zhao, Lihe Zhang et al.

NEURIPS 2025arXiv:2509.16888

#17945

OrthoLoC: UAV 6-DoF Localization and Calibration Using Orthographic Geodata

Oussema Dhaouadi, Riccardo Marin, Johannes Meier et al.

NEURIPS 2025oralarXiv:2509.18350

#17946

AnomalyCoT: A Multi-Scenario Chain-of-Thought Dataset for Multimodal Large Language Models

Jiaxi Cheng, Yuliang Xu, Shoupeng Wang et al.

NEURIPS 2025spotlightarXiv:2412.01605

#17947

MedChain: Bridging the Gap Between LLM Agents and Clinical Practice with Interactive Sequence

Jie Liu, Wenxuan Wang, Zizhan Ma et al.

#17948

Universal Image Restoration Pre-training via Degradation Classification

Jiakui Hu, Lujia Jin, Zhengjian Yao et al.

ICLR 2025arXiv:2501.15510

#17949

On the Benefits of Attribute-Driven Graph Domain Adaptation

Ruiyi Fang, Bingheng Li, zhao kang et al.

ICLR 2025arXiv:2502.06808

#17950

Port-Hamiltonian Architectural Bias for Long-Range Propagation in Deep Graph Networks

Simon Heilig, Alessio Gravina, Alessandro Trenta et al.

ICLR 2025arXiv:2405.17163

#17951

From an LLM Swarm to a PDDL-empowered Hive: Planning Self-executed Instructions in a Multi-modal Jungle

Kaustubh Vyas, Damien Graux, Yijun Yang et al.

ICLR 2025arXiv:2412.12839

#17952

Contextual Self-paced Learning for Weakly Supervised Spatio-Temporal Video Grounding

Akash Kumar, Zsolt Kira, Yogesh S Rawat

ICLR 2025oralarXiv:2501.17053

#17953

Repurposing in AI: A Distinct Approach or an Extension of Creative Problem Solving?

Aissatou Diallo, Antonis Bikakis, Luke Dickens et al.

ICLR 2025arXiv:2504.15208

#17954

Compute-Optimal LLMs Provably Generalize Better with Scale

Marc Finzi, Sanyam Kapoor, Diego Granziol et al.

#17955

CodeMMLU: A Multi-Task Benchmark for Assessing Code Understanding & Reasoning Capabilities of CodeLLMs

Dung Nguyen, Thang Phan, Nam Le Hai et al.

ICLR 2025arXiv:2410.01999

#17956

Decoupled Subgraph Federated Learning

Javad Aliakbari, Johan Östman, Alexandre Graell i Amat

ICLR 2025arXiv:2402.19163

#17957

Everything, Everywhere, All at Once: Is Mechanistic Interpretability Identifiable?

Maxime Méloux, Silviu Maniu, François Portet et al.

ICLR 2025arXiv:2502.20914

#17958

Diffusion Bridge Implicit Models

Kaiwen Zheng, Guande He, Jianfei Chen et al.

ICLR 2025arXiv:2405.15885

#17959

Beyond Worst-Case Dimensionality Reduction for Sparse Vectors

Sandeep Silwal, David Woodruff, Qiuyi (Richard) Zhang

ICLR 2025arXiv:2502.19865

#17960

Elucidating the Preconditioning in Consistency Distillation

Kaiwen Zheng, Guande He, Jianfei Chen et al.

ICLR 2025arXiv:2502.02922

#17961

Improving Data Efficiency via Curating LLM-Driven Rating Systems

Jinlong Pang, Jiaheng Wei, Ankit Parag Shah et al.

ICLR 2025arXiv:2410.10877

#17962

Achieving Dimension-Free Communication in Federated Learning via Zeroth-Order Optimization

Zhe Li, Bicheng Ying, Zidong Liu et al.

ICLR 2025arXiv:2405.15861

#17963

Chain-of-Thought Provably Enables Learning the (Otherwise) Unlearnable

Chenxiao Yang, Zhiyuan Li, David Wipf

#17964

Understanding Warmup-Stable-Decay Learning Rates: A River Valley Loss Landscape View

Kaiyue Wen, Zhiyuan Li, Jason Wang et al.

ICLR 2025arXiv:2410.01131

#17965

nGPT: Normalized Transformer with Representation Learning on the Hypersphere

Ilya Loshchilov, Cheng-Ping Hsieh, Simeng Sun et al.

#17966

A Coefficient Makes SVRG Effective

Yida Yin, Zhiqiu Xu, Zhiyuan Li et al.

ICLR 2025arXiv:2311.05589

#17967

Homomorphism Counts as Structural Encodings for Graph Learning

Linus Bao, Emily Jin, Michael Bronstein et al.

ICLR 2025arXiv:2410.18676

#17968

PhysPDE: Rethinking PDE Discovery and a Physical HYpothesis Selection Benchmark

Mingquan Feng, Yixin Huang, Yizhou Liu et al.

ICLR 2025arXiv:2410.08198

#17969

Adam Exploits $\ell_\infty$-geometry of Loss Landscape via Coordinate-wise Adaptivity

Shuo Xie, Mohamad Amin Mohamadi, Zhiyuan Li

#17970

Near-Optimal Policy Identification in Robust Constrained Markov Decision Processes via Epigraph Form

Toshinori Kitamura, Tadashi Kozuno, Wataru Kumagai et al.

ICLR 2025arXiv:2408.16286

#17971

Optimality and Adaptivity of Deep Neural Features for Instrumental Variable Regression

Juno Kim, Dimitri Meunier, Arthur Gretton et al.

ICLR 2025arXiv:2501.04898

#17972

TC-MoE: Augmenting Mixture of Experts with Ternary Expert Choice

Shen Yan, Xingyan Bin, Sijun Zhang et al.

ICLR 2025arXiv:2408.15495

#17973

Remove Symmetries to Control Model Expressivity and Improve Optimization

Liu Ziyin, Yizhou Xu, Isaac Chuang

#17974

JPEG Inspired Deep Learning

Ahmed Hussien Salamah, Kaixiang Zheng, Yiwen Liu et al.

ICLR 2025arXiv:2410.07081

#17975

ChatQA 2: Bridging the Gap to Proprietary LLMs in Long Context and RAG Capabilities

Peng Xu, Wei Ping, Xianchao Wu et al.

ICLR 2025arXiv:2407.14482

#17976

gRNAde: Geometric Deep Learning for 3D RNA inverse design

Chaitanya Joshi, Arian Jamasb, Ramon Viñas et al.

ICLR 2025arXiv:2305.14749

#17977

Boltzmann priors for Implicit Transfer Operators

Juan Viguera Diez, Mathias Schreiner, Ola Engkvist et al.

ICLR 2025arXiv:2410.10605

#17978

Biologically Constrained Barrel Cortex Model Integrates Whisker Inputs and Replicates Key Brain Network Dynamics

Tianfang Zhu, Dongli Hu, Jiandong Zhou et al.

ICLR 2025oral

#17979

Pairwise Elimination with Instance-Dependent Guarantees for Bandits with Cost Subsidy

Ishank Juneja, Carlee Joe-Wong, Osman Yagan

ICLR 2025arXiv:2501.10290

#17980

In-Context Editing: Learning Knowledge from Self-Induced Distributions

Siyuan Qi, Bangcheng Yang, Kailin Jiang et al.

ICLR 2025arXiv:2406.11194

#17981

Towards Understanding the Universality of Transformers for Next-Token Prediction

Michael Sander, Gabriel Peyré

ICLR 2025arXiv:2410.03011

#17982

Learning Task Belief Similarity with Latent Dynamics for Meta-Reinforcement Learning

Menglong Zhang, Fuyuan Qian, Quanying Liu

ICLR 2025oralarXiv:2506.19785

#17983

CryoGEN: Generative Energy-based Models for Cryogenic Electron Tomography Reconstruction

Yunfei Teng, Yuxuan Ren, Kai Chen et al.

#17984

KAN: Kolmogorov–Arnold Networks

Ziming Liu, Yixuan Wang, Sachin Vaidya et al.

#17985

Online Clustering with Nearly Optimal Consistency

T-H. Hubert Chan, Shaofeng Jiang, Tianyi Wu et al.

ICLR 2025arXiv:2410.11081

#17986

Simplifying, Stabilizing and Scaling Continuous-time Consistency Models

Cheng Lu, Yang Song

#17987

The Geometry of Categorical and Hierarchical Concepts in Large Language Models

Kiho Park, Yo Joong Choe, Yibo Jiang et al.

ICLR 2025arXiv:2406.01506

#17988

Adversarial Training Can Provably Improve Robustness: Theoretical Analysis of Feature Learning Process Under Structured Data

Binghui Li, Yuanzhi Li

ICLR 2025arXiv:2410.08503

#17989

TRENDy: Temporal Regression of Effective Nonlinear Dynamics

Matthew Ricci, Guy Pelc, Zoe Piran et al.

ICLR 2025oralarXiv:2412.03496

#17990

Regularized Proportional Fairness Mechanism for Resource Allocation Without Money

Sujay Bhatt, Alec Koppel, Sumitra Ganesh et al.

ICLR 2025arXiv:2501.01111

#17991

Dynamic Neural Fortresses: An Adaptive Shield for Model Extraction Defense

Siyu Luan, Zhenyi Wang, Li Shen et al.

#17992

Protein Language Model Fitness is a Matter of Preference

Cade Gordon, Amy Lu, Pieter Abbeel

#17993

Watch Less, Do More: Implicit Skill Discovery for Video-Conditioned Policy

Wang, Zongqing Lu

#17994

Learning and aligning single-neuron invariance manifolds in visual cortex

Mohammad Bashiri, Luca Baroni, Ján Antolík et al.

ICLR 2025arXiv:2410.02155

#17995

From Pixels to Tokens: Byte-Pair Encoding on Quantized Visual Modalities

Wanpeng Zhang, Zilong Xie, Yicheng Feng et al.

#17996

Cross-Domain Offline Policy Adaptation with Optimal Transport and Dataset Constraint

Jiafei Lyu, Mengbei Yan, Zhongjian Qiao et al.

ICLR 2025arXiv:2406.09836

#17997

Robustness Inspired Graph Backdoor Defense

Zhiwei Zhang, Minhua Lin, Junjie Xu et al.

#17998

Do You Keep an Eye on What I Ask? Mitigating Multimodal Hallucination via Attention-Guided Ensemble Decoding

Yeongjae Cho, Keonwoo Kim, Taebaek Hwang et al.

ICLR 2025arXiv:2505.17529

#17999

Lost in Prediction: Why Social Media Narratives Don't Help Macroeconomic Forecasting?

Almog Gueta, Roi Reichart, Amir Feder et al.