Most Cited ICLR "sft" Papers

6,124 papers found • Page 14 of 31

Conference

AAAI 2025 (3,028)COLM 2025 (418)CVPR 2025 (2,873)ICCV 2025 (2,701)ICLR 2025 (3,827)ICML 2025 (3,340)ISMAR 2025 (229)NEURIPS 2025 (5,858)AAAI 2024 (2,289)CVPR 2024 (2,716)ECCV 2024 (2,387)ICLR 2024 (2,297)ICML 2024 (2,635)

Paper Type

poster (24,624)paper (8,558)oral (1,594)spotlight (1,421)highlight (975)

#2601

TGB-Seq Benchmark: Challenging Temporal GNNs with Complex Sequential Dynamics

Lu Yi, Jie Peng, Yanping Zheng et al.

ICLR 2025oralarXiv:2502.02975

citations

#2602

Retrieval is Accurate Generation

Bowen Cao, Deng Cai, Leyang Cui et al.

ICLR 2024arXiv:2402.17532

citations

#2603

Prompt Risk Control: A Rigorous Framework for Responsible Deployment of Large Language Models

Thomas Zollo, Todd Morrill, Zhun Deng et al.

ICLR 2024arXiv:2311.13628

citations

#2604

Linear Log-Normal Attention with Unbiased Concentration

Yury Nahshan, Joseph Kampeas, Emir Haleva

ICLR 2024arXiv:2311.13541

citations

#2605

Everything, Everywhere, All at Once: Is Mechanistic Interpretability Identifiable?

Maxime Méloux, Silviu Maniu, François Portet et al.

ICLR 2025arXiv:2502.20914

citations

#2606

Variance Reduced Halpern Iteration for Finite-Sum Monotone Inclusions

Xufeng Cai, Ahmet Alacaoglu, Jelena Diakonikolas

ICLR 2024arXiv:2310.02987

citations

#2607

Advancing Mathematical Reasoning in Language Models: The Impact of Problem-Solving Data, Data Synthesis Methods, and Training Stages

Zui Chen, Tianqiao Liu, Tongqing et al.

ICLR 2025arXiv:2501.14002

citations

#2608

SANER: Annotation-free Societal Attribute Neutralizer for Debiasing CLIP

Yusuke Hirota, Min-Hung Chen, Chien-Yi Wang et al.

ICLR 2025arXiv:2408.10202

citations

#2609

DAFA: Distance-Aware Fair Adversarial Training

Hyungyu Lee, Saehyung Lee, Hyemi Jang et al.

ICLR 2024arXiv:2401.12532

citations

#2610

Language-Informed Visual Concept Learning

Sharon Lee, Yunzhi Zhang, Shangzhe Wu et al.

ICLR 2024arXiv:2312.03587

citations

#2611

Generative Classifiers Avoid Shortcut Solutions

Alexander Li, Ananya Kumar, Deepak Pathak

ICLR 2025arXiv:2512.25034

citations

#2612

A Simple and Scalable Representation for Graph Generation

Yunhui Jang, Seul Lee, Sungsoo Ahn

ICLR 2024arXiv:2312.02230

citations

#2613

Manifold Learning by Mixture Models of VAEs for Inverse Problems

Giovanni S. Alberti, Johannes Hertrich, Matteo Santacesaria et al.

ICLR 2025arXiv:2303.15244

citations

#2614

Modeling Fine-Grained Hand-Object Dynamics for Egocentric Video Representation Learning

Baoqi Pei, Yifei Huang, Jilan Xu et al.

ICLR 2025arXiv:2503.00986

citations

#2615

Mastering Symbolic Operations: Augmenting Language Models with Compiled Neural Networks

Yixuan Weng, Minjun Zhu, Fei Xia et al.

ICLR 2024arXiv:2304.01665

citations

#2616

Solving New Tasks by Adapting Internet Video Knowledge

Calvin Luo, Zilai Zeng, Yilun Du et al.

ICLR 2025arXiv:2504.15369

citations

#2617

QP-SNN: Quantized and Pruned Spiking Neural Networks

Wenjie Wei, Malu Zhang, Zijian Zhou et al.

ICLR 2025oralarXiv:2502.05905

citations

#2618

SVG: 3D Stereoscopic Video Generation via Denoising Frame Matrix

Peng Dai, Feitong Tan, Qiangeng Xu et al.

ICLR 2025arXiv:2407.00367

citations

#2619

Rethinking Diffusion Posterior Sampling: From Conditional Score Estimator to Maximizing a Posterior

Tongda Xu, Xiyan Cai, Xinjie Zhang et al.

ICLR 2025arXiv:2501.18913

citations

#2620

Skill Expansion and Composition in Parameter Space

Tenglong Liu, Jianxiong Li, Yinan Zheng et al.

ICLR 2025arXiv:2502.05932

citations

#2621

Game-Theoretic Robust Reinforcement Learning Handles Temporally-Coupled Perturbations

Yongyuan Liang, Yanchao Sun, Ruijie Zheng et al.

ICLR 2024oralarXiv:2307.12062

citations

#2622

A Plug-and-Play Image Registration Network

JUNHAO HU, Weijie Gan, Zhixin Sun et al.

ICLR 2024arXiv:2310.04297

citations

#2623

Transformer-Squared: Self-adaptive LLMs

Qi Sun, Edoardo Cetin, Yujin Tang

ICLR 2025arXiv:2501.06252

citations

#2624

Generalizability of Adversarial Robustness Under Distribution Shifts

Bernard Ghanem, Kumail Alhamoud, Hasan Hammoud et al.

ICLR 2024

citations

#2625

STARC: A General Framework For Quantifying Differences Between Reward Functions

Joar Skalse, Lucy Farnik, Sumeet Motwani et al.

ICLR 2024arXiv:2309.15257

citations

#2626

On the Identification of Temporal Causal Representation with Instantaneous Dependence

Zijian Li, Yifan Shen, Kaitao Zheng et al.

ICLR 2025oralarXiv:2405.15325

citations

#2627

RecFlow: An Industrial Full Flow Recommendation Dataset

Qi Liu, Kai Zheng, Rui Huang et al.

ICLR 2025arXiv:2410.20868

citations

#2628

Training LLMs over Neurally Compressed Text

Brian Lester, Jaehoon Lee, Jeffrey Pennington et al.

ICLR 2025arXiv:2404.03626

citations

#2629

P-SPIKESSM: HARNESSING PROBABILISTIC SPIKING STATE SPACE MODELS FOR LONG-RANGE DEPENDENCY TASKS

Malyaban Bal, Abhronil Sengupta

ICLR 2025arXiv:2406.02923

citations

#2630

Provable Convergence and Limitations of Geometric Tempering for Langevin Dynamics

Omar Chehab, Anna Korba, Austin Stromme et al.

ICLR 2025arXiv:2410.09697

citations

#2631

Coreset Selection via Reducible Loss in Continual Learning

Ruilin Tong, Yuhang Liu, Javen Qinfeng Shi et al.

ICLR 2025

citations

#2632

Kalman Filter for Online Classification of Non-Stationary Data

Michalis Titsias, Alexandre Galashov, Amal Rannen-Triki et al.

ICLR 2024arXiv:2306.08448

citations

#2633

From Pixels to Tokens: Byte-Pair Encoding on Quantized Visual Modalities

Wanpeng Zhang, Zilong Xie, Yicheng Feng et al.

ICLR 2025arXiv:2410.02155

citations

#2634

Geometry of Lightning Self-Attention: Identifiability and Dimension

Nathan Henry, Giovanni Luca Marchetti, Kathlén Kohn

ICLR 2025arXiv:2408.17221

citations

#2635

SV-RAG: LoRA-Contextualizing Adaptation of MLLMs for Long Document Understanding

Jian Chen, Ruiyi Zhang, Yufan Zhou et al.

ICLR 2025arXiv:2411.01106

citations

#2636

TopoNets: High performing vision and language models with brain-like topography

Mayukh Deb, Mainak Deb, Apurva Murty

ICLR 2025arXiv:2501.16396

citations

#2637

Unlocking Efficient, Scalable, and Continual Knowledge Editing with Basis-Level Representation Fine-Tuning

Tianci Liu, Ruirui Li, Yunzhe Qi et al.

ICLR 2025arXiv:2503.00306

citations

#2638

Formation of Representations in Neural Networks

Liu Ziyin, Isaac Chuang, Tomer Galanti et al.

ICLR 2025arXiv:2410.03006

citations

#2639

Broadening Target Distributions for Accelerated Diffusion Models via a Novel Analysis Approach

Yuchen Liang, Peizhong Ju, Yingbin Liang et al.

ICLR 2025arXiv:2402.13901

citations

#2640

ZeroFlow: Scalable Scene Flow via Distillation

Kyle Vedder, Neehar Peri, Nathaniel Chodosh et al.

ICLR 2024oralarXiv:2305.10424

citations

#2641

Neural Atoms: Propagating Long-range Interaction in Molecular Graphs through Efficient Communication Channel

Xuan Li, Zhanke Zhou, Jiangchao Yao et al.

ICLR 2024arXiv:2311.01276

citations

#2642

EX-Graph: A Pioneering Dataset Bridging Ethereum and X

Qian Wang, Zhen Zhang, Zemin Liu et al.

ICLR 2024arXiv:2310.01015

citations

#2643

Sitcom-Crafter: A Plot-Driven Human Motion Generation System in 3D Scenes

Jianqi Chen, Panwen Hu, Xiaojun Chang et al.

ICLR 2025arXiv:2410.10790

citations

#2644

KBLaM: Knowledge Base augmented Language Model

Xi Wang, Taketomo Isazawa, Liana Mikaelyan et al.

ICLR 2025arXiv:2410.10450

citations

#2645

Beyond Stationarity: Convergence Analysis of Stochastic Softmax Policy Gradient Methods

Sara Klein, Simon Weissmann, Leif Döring

ICLR 2024arXiv:2310.02671

citations

#2646

H2O-SDF: Two-phase Learning for 3D Indoor Reconstruction using Object Surface Fields

Minyoung Park, MIRAE DO, Yeon Jae Shin et al.

ICLR 2024spotlightarXiv:2402.08138

citations

#2647

Point2SSM: Learning Morphological Variations of Anatomies from Point Clouds

Jadie Adams, Shireen Elhabian

ICLR 2024spotlightarXiv:2305.14486

citations

#2648

Long-Sequence Recommendation Models Need Decoupled Embeddings

Ningya Feng, Junwei Pan, Jialong Wu et al.

ICLR 2025arXiv:2410.02604

citations

#2649

Efficient Integrators for Diffusion Generative Models

Kushagra Pandey, Maja Rudolph, Stephan Mandt

ICLR 2024arXiv:2310.07894

citations

#2650

LiveXiv - A Multi-Modal live benchmark based on Arxiv papers content

Nimrod Shabtay, Felipe Maia Polo, Sivan Doveh et al.

ICLR 2025arXiv:2410.10783

citations

#2651

Optimal Sample Complexity of Contrastive Learning

Noga Alon, Dmitrii Avdiukhin, Dor Elboim et al.

ICLR 2024spotlightarXiv:2312.00379

citations

#2652

Proxy Denoising for Source-Free Domain Adaptation

Song Tang, Wenxin Su, Yan Gan et al.

ICLR 2025arXiv:2406.01658

citations

#2653

3D-Aware Hypothesis & Verification for Generalizable Relative Object Pose Estimation

Chen Zhao, Tong Zhang, Mathieu Salzmann

ICLR 2024arXiv:2310.03534

citations

#2654

What's the Move? Hybrid Imitation Learning via Salient Points

Priya Sundaresan, Hengyuan Hu, Quan Vuong et al.

ICLR 2025arXiv:2412.05426

citations

#2655

Plastic Learning with Deep Fourier Features

Alex Lewandowski, Dale Schuurmans, Marlos C. Machado

ICLR 2025arXiv:2410.20634

citations

#2656

TopoLM: brain-like spatio-functional organization in a topographic language model

Neil Rathi, Johannes Mehrer, Badr AlKhamissi et al.

ICLR 2025arXiv:2410.11516

citations

#2657

TLDR: Token-Level Detective Reward Model for Large Vision Language Models

Deqing Fu, Tong Xiao, Rui Wang et al.

ICLR 2025arXiv:2410.04734

citations

#2658

ReSi: A Comprehensive Benchmark for Representational Similarity Measures

Max Klabunde, Tassilo Wald, Tobias Schumacher et al.

ICLR 2025arXiv:2408.00531

citations

#2659

Sparse Autoencoders Reveal Temporal Difference Learning in Large Language Models

Can Demircan, Tankred Saanum, Akshay Jagadish et al.

ICLR 2025oralarXiv:2410.01280

citations

#2660

In-Context Learning Dynamics with Random Binary Sequences

Eric Bigelow, Ekdeep Singh Lubana, Robert Dick et al.

ICLR 2024oralarXiv:2310.17639

citations

#2661

Cauchy-Schwarz Divergence Information Bottleneck for Regression

Shujian Yu, Xi Yu, Sigurd Løkse et al.

ICLR 2024arXiv:2404.17951

citations

#2662

POGEMA: A Benchmark Platform for Cooperative Multi-Agent Pathfinding

Alexey Skrynnik, Anton Andreychuk, Anatolii Borzilov et al.

ICLR 2025arXiv:2407.14931

citations

#2663

Exploring the Effectiveness of Object-Centric Representations in Visual Question Answering: Comparative Insights with Foundation Models

Amir Mohammad Karimi Mamaghan, Samuele Papa, Karl H. Johansson et al.

ICLR 2025arXiv:2407.15589

citations

#2664

Differentially Private SGD Without Clipping Bias: An Error-Feedback Approach

Xinwei Zhang, Zhiqi Bu, Steven Wu et al.

ICLR 2024arXiv:2311.14632

citations

#2665

Precise Localization of Memories: A Fine-grained Neuron-level Knowledge Editing Technique for LLMs

Haowen Pan, Xiaozhi Wang, Yixin Cao et al.

ICLR 2025arXiv:2503.01090

citations

#2666

Backdoor Contrastive Learning via Bi-level Trigger Optimization

Weiyu Sun, Xinyu Zhang, Hao LU et al.

ICLR 2024arXiv:2404.07863

citations

#2667

Interleaved Scene Graphs for Interleaved Text-and-Image Generation Assessment

Dongping Chen, Ruoxi Chen, Shu Pu et al.

ICLR 2025arXiv:2411.17188

citations

#2668

Law of the Weakest Link: Cross Capabilities of Large Language Models

Ming Zhong, Aston Zhang, Xuewei Wang et al.

ICLR 2025arXiv:2409.19951

citations

#2669

GRANDE: Gradient-Based Decision Tree Ensembles for Tabular Data

Sascha Marton, Stefan Lüdtke, Christian Bartelt et al.

ICLR 2024arXiv:2309.17130

citations

#2670

SpaceGNN: Multi-Space Graph Neural Network for Node Anomaly Detection with Extremely Limited Labels

Xiangyu Dong, Xingyi Zhang, Lei Chen et al.

ICLR 2025arXiv:2502.03201

citations

#2671

AdaManip: Adaptive Articulated Object Manipulation Environments and Policy Learning

Yuanfei Wang, Xiaojie Zhang, Ruihai Wu et al.

ICLR 2025arXiv:2502.11124

citations

#2672

A Meta-Learning Approach to Bayesian Causal Discovery

Anish Dhir, Matthew Ashman, James Requeima et al.

ICLR 2025arXiv:2412.16577

citations

#2673

Latent-EnSF: A Latent Ensemble Score Filter for High-Dimensional Data Assimilation with Sparse Observation Data

Phillip Si, Peng Chen

ICLR 2025arXiv:2409.00127

citations

#2674

Illusory Attacks: Information-theoretic detectability matters in adversarial attacks

Tim Franzmeyer, Stephen McAleer, Joao F. Henriques et al.

ICLR 2024spotlightarXiv:2207.10170

citations

#2675

MMEgo: Towards Building Egocentric Multimodal LLMs for Video QA

Hanrong Ye, Haotian Zhang, Erik Daxberger et al.

ICLR 2025

citations

#2676

Vec2Face: Scaling Face Dataset Generation with Loosely Constrained Vectors

Haiyu Wu, Jaskirat Singh, Sicong Tian et al.

ICLR 2025arXiv:2409.02979

citations

#2677

AdaRankGrad: Adaptive Gradient Rank and Moments for Memory-Efficient LLMs Training and Fine-Tuning

Yehonathan Refael, Jonathan Svirsky, Boris Shustin et al.

ICLR 2025arXiv:2410.17881

citations

#2678

Improving the Sparse Structure Learning of Spiking Neural Networks from the View of Compression Efficiency

Jiangrong Shen, Qi Xu, Gang Pan et al.

ICLR 2025arXiv:2502.13572

citations

#2679

Pareto Deep Long-Tailed Recognition: A Conflict-Averse Solution

Zhipeng Zhou, Liu Liu, Peilin Zhao et al.

ICLR 2024oral

citations

#2680

Goodhart's Law in Reinforcement Learning

Jacek Karwowski, Oliver Hayman, Xingjian Bai et al.

ICLR 2024arXiv:2310.09144

citations

#2681

H-GAP: Humanoid Control with a Generalist Planner

Zhengyao Jiang, Yingchen Xu, Nolan Wagener et al.

ICLR 2024spotlightarXiv:2312.02682

citations

#2682

MetaUrban: An Embodied AI Simulation Platform for Urban Micromobility

Wayne Wu, Honglin He, Jack He et al.

ICLR 2025arXiv:2407.08725

citations

#2683

Interaction Asymmetry: A General Principle for Learning Composable Abstractions

Jack Brady, Julius von Kügelgen, Sebastien Lachapelle et al.

ICLR 2025arXiv:2411.07784

citations

#2684

Visual Data-Type Understanding does not emerge from scaling Vision-Language Models

Vishaal Udandarao, Max F. Burg, Samuel Albanie et al.

ICLR 2024arXiv:2310.08577

citations

#2685

Diffusion Models as Cartoonists: The Curious Case of High Density Regions

Rafał Karczewski, Markus Heinonen, Vikas Garg

ICLR 2025arXiv:2411.01293

citations

#2686

Improving Offline RL by Blending Heuristics

Sinong Geng, Aldo Pacchiano, Andrey Kolobov et al.

ICLR 2024spotlightarXiv:2306.00321

citations

#2687

Do as I do (Safely): Mitigating Task-Specific Fine-tuning Risks in Large Language Models

Francisco Eiras, Aleksandar Petrov, Philip Torr et al.

ICLR 2025arXiv:2406.10288

citations

#2688

Differentiable Optimization of Similarity Scores Between Models and Brains

Nathan Cloos, Moufan Li, Markus Siegel et al.

ICLR 2025arXiv:2407.07059

citations

#2689

Dual Process Learning: Controlling Use of In-Context vs. In-Weights Strategies with Weight Forgetting

Suraj Anand, Michael Lepori, Jack Merullo et al.

ICLR 2025arXiv:2406.00053

citations

#2690

Designing Skill-Compatible AI: Methodologies and Frameworks in Chess

KARIM HAMADE, Reid McIlroy-Young, Siddhartha Sen et al.

ICLR 2024arXiv:2405.05066

citations

#2691

Workflow Discovery from Dialogues in the Low Data Regime

David Vazquez, Stefania Raimondo, Christopher Pal et al.

ICLR 2024

citations

#2692

Federated Causal Discovery from Heterogeneous Data

Loka Li, Ignavier Ng, Gongxu Luo et al.

ICLR 2024arXiv:2402.13241

citations

#2693

Residual Stream Analysis with Multi-Layer SAEs

Tim Lawson, Lucy Farnik, Conor Houghton et al.

ICLR 2025arXiv:2409.04185

citations

#2694

Revisiting In-context Learning Inference Circuit in Large Language Models

Hakaze Cho, Mariko Kato, Yoshihiro Sakai et al.

ICLR 2025arXiv:2410.04468

citations

#2695

Rethinking Invariance in In-context Learning

Lizhe Fang, Yifei Wang, Khashayar Gatmiry et al.

ICLR 2025arXiv:2505.04994

citations

#2696

Empowering Users in Digital Privacy Management through Interactive LLM-Based Agents

Bolun Sun, Yifan Zhou, Haiyun Jiang

ICLR 2025arXiv:2410.11906

citations

#2697

Strategist: Self-improvement of LLM Decision Making via Bi-Level Tree Search

Jonathan Light, Min Cai, Weiqin Chen et al.

ICLR 2025arXiv:2408.10635

citations

#2698

Topological Blindspots: Understanding and Extending Topological Deep Learning Through the Lens of Expressivity

Yam Eitan, Yoav Gelberg, Guy Bar-Shalom et al.

ICLR 2025arXiv:2408.05486

citations

#2699

Magnitude Invariant Parametrizations Improve Hypernetwork Learning

Jose Javier Gonzalez Ortiz, John Guttag, Adrian Dalca

ICLR 2024arXiv:2304.07645

citations

#2700

SePer: Measure Retrieval Utility Through The Lens Of Semantic Perplexity Reduction

Lu Dai, Yijie Xu, Jinhui Ye et al.

ICLR 2025arXiv:2503.01478

citations

#2701

On the Benefits of Attribute-Driven Graph Domain Adaptation

Ruiyi Fang, Bingheng Li, zhao kang et al.

ICLR 2025arXiv:2502.06808

citations

#2702

DisEnvisioner: Disentangled and Enriched Visual Prompt for Customized Image Generation

Jing He, Haodong Li, huyongzhe et al.

ICLR 2025arXiv:2410.02067

citations

#2703

Efficiently Parameterized Neural Metriplectic Systems

Anthony Gruber, Kookjin Lee, Haksoo Lim et al.

ICLR 2025arXiv:2405.16305

citations

#2704

metabench - A Sparse Benchmark of Reasoning and Knowledge in Large Language Models

Alex Kipnis, Konstantinos Voudouris, Luca Schulze Buschoff et al.

ICLR 2025arXiv:2407.12844

citations

#2705

On Conformal Isometry of Grid Cells: Learning Distance-Preserving Position Embedding

Dehong Xu, Ruiqi Gao, Wenhao Zhang et al.

ICLR 2025arXiv:2405.16865

citations

#2706

TIGER: Time-frequency Interleaved Gain Extraction and Reconstruction for Efficient Speech Separation

Mohan Xu, Kai Li, Guo Chen et al.

ICLR 2025oralarXiv:2410.01469

citations

#2707

Probing the Latent Hierarchical Structure of Data via Diffusion Models

Antonio Sclocchi, Alessandro Favero, Noam Levi et al.

ICLR 2025arXiv:2410.13770

citations

#2708

Proper Laplacian Representation Learning

Diego Gomez, Michael Bowling, Marlos C. Machado

ICLR 2024oralarXiv:2310.10833

citations

#2709

MMDT: Decoding the Trustworthiness and Safety of Multimodal Foundation Models

Chejian Xu, Jiawei Zhang, Zhaorun Chen et al.

ICLR 2025arXiv:2503.14827

citations

#2710

Learning Decentralized Partially Observable Mean Field Control for Artificial Collective Behavior

Kai Cui, Sascha Hauck, Christian Fabian et al.

ICLR 2024arXiv:2307.06175

citations

#2711

Detecting Backdoor Samples in Contrastive Language Image Pretraining

Hanxun Huang, Sarah Erfani, Yige Li et al.

ICLR 2025arXiv:2502.01385

citations

#2712

The Utility and Complexity of In- and Out-of-Distribution Machine Unlearning

Youssef Allouah, Joshua Kazdan, Rachid Guerraoui et al.

ICLR 2025arXiv:2412.09119

citations

#2713

Hidden in the Noise: Two-Stage Robust Watermarking for Images

Kasra Arabi, Benjamin Feuer, R. Teal Witter et al.

ICLR 2025arXiv:2412.04653

citations

#2714

SRSA: Skill Retrieval and Adaptation for Robotic Assembly Tasks

Yijie Guo, Bingjie Tang, Iretiayo Akinola et al.

ICLR 2025arXiv:2503.04538

citations

#2715

Pareto Low-Rank Adapters: Efficient Multi-Task Learning with Preferences

Nikos Dimitriadis, Pascal Frossard, François Fleuret

ICLR 2025arXiv:2407.08056

citations

#2716

Stochastic Polyak Step-sizes and Momentum: Convergence Guarantees and Practical Performance

Dimitris Oikonomou, Nicolas Loizou

ICLR 2025arXiv:2406.04142

citations

#2717

Understanding Virtual Nodes: Oversquashing and Node Heterogeneity

Joshua Southern, Francesco Di Giovanni, Michael Bronstein et al.

ICLR 2025arXiv:2405.13526

citations

#2718

Pre-training with Synthetic Data Helps Offline Reinforcement Learning

Zecheng Wang, Che Wang, Zixuan Dong et al.

ICLR 2024arXiv:2310.00771

citations

#2719

BatteryML: An Open-source Platform for Machine Learning on Battery Degradation

Han Zhang, Xiaofan Gui, Shun Zheng et al.

ICLR 2024spotlight

citations

#2720

The Computational Complexity of Circuit Discovery for Inner Interpretability

Federico Adolfi, Martina G. Vilas, Todd Wareham

ICLR 2025arXiv:2410.08025

citations

#2721

Task Adaptation from Skills: Information Geometry, Disentanglement, and New Objectives for Unsupervised Reinforcement Learning

Yucheng Yang, Tianyi Zhou, Qiang HE et al.

ICLR 2024spotlightarXiv:2506.10629

citations

#2722

Free from Bellman Completeness: Trajectory Stitching via Model-based Return-conditioned Supervised Learning

Zhaoyi Zhou, Chuning Zhu, Runlong Zhou et al.

ICLR 2024arXiv:2310.19308

citations

#2723

Boltzmann priors for Implicit Transfer Operators

Juan Viguera Diez, Mathias Schreiner, Ola Engkvist et al.

ICLR 2025arXiv:2410.10605

citations

#2724

Provably Efficient Iterated CVaR Reinforcement Learning with Function Approximation and Human Feedback

Yu Chen, Yihan Du, Pihe Hu et al.

ICLR 2024arXiv:2307.02842

citations

#2725

Causal Fairness under Unobserved Confounding: A Neural Sensitivity Framework

Maresa Schröder, Dennis Frauen, Stefan Feuerriegel

ICLR 2024arXiv:2311.18460

citations

#2726

MambaPEFT: Exploring Parameter-Efficient Fine-Tuning for Mamba

Masakazu Yoshimura, Teruaki Hayashi, Yota Maeda

ICLR 2025arXiv:2411.03855

citations

#2727

Revisiting Energy Based Models as Policies: Ranking Noise Contrastive Estimation and Interpolating Energy Models

Sumeet Singh, Vikas Sindhwani, Stephen Tu

ICLR 2025arXiv:2309.05803

citations

#2728

ViSAGe: Video-to-Spatial Audio Generation

Jaeyeon Kim, Heeseung Yun, Gunhee Kim

ICLR 2025oralarXiv:2506.12199

citations

#2729

Understanding Model Calibration - A gentle introduction and visual exploration of calibration and the expected calibration error (ECE)

Maja Pavlovic

ICLR 2025arXiv:2501.19047

citations

#2730

IgGM: A Generative Model for Functional Antibody and Nanobody Design

Rubo Wang, Fandi Wu, Xingyu Gao et al.

ICLR 2025

citations

#2731

TweedieMix: Improving Multi-Concept Fusion for Diffusion-based Image/Video Generation

Gihyun Kwon, Jong Chul YE

ICLR 2025arXiv:2410.05591

citations

#2732

R-Sparse: Rank-Aware Activation Sparsity for Efficient LLM Inference

Zhenyu Zhang, Zechun Liu, Yuandong Tian et al.

ICLR 2025arXiv:2504.19449

citations

#2733

InstructPix2NeRF: Instructed 3D Portrait Editing from a Single Image

Jianhui Li, Shilong Liu, Zidong Liu et al.

ICLR 2024arXiv:2311.02826

citations

#2734

Open the Black Box: Step-based Policy Updates for Temporally-Correlated Episodic Reinforcement Learning

Ge Li, Hongyi Zhou, Dominik Roth et al.

ICLR 2024oralarXiv:2401.11437

citations

#2735

Activation Gradient based Poisoned Sample Detection Against Backdoor Attacks

Danni Yuan, Mingda Zhang, Shaokui Wei et al.

ICLR 2025arXiv:2312.06230

citations

#2736

QERA: an Analytical Framework for Quantization Error Reconstruction

Cheng Zhang, Jeffrey T. H. Wong, Can Xiao et al.

ICLR 2025arXiv:2410.06040

citations

#2737

On the Crucial Role of Initialization for Matrix Factorization

Bingcong Li, Liang Zhang, Aryan Mokhtari et al.

ICLR 2025arXiv:2410.18965

citations

#2738

MLPs Learn In-Context on Regression and Classification Tasks

William Tong, Cengiz Pehlevan

ICLR 2025arXiv:2405.15618

citations

#2739

LoRA3D: Low-Rank Self-Calibration of 3D Geometric Foundation models

Ziqi Lu, Heng Yang, Danfei Xu et al.

ICLR 2025arXiv:2412.07746

citations

#2740

Stochastic Modified Equations and Dynamics of Dropout Algorithm

Zhongwang Zhang, Yuqing Li, Tao Luo et al.

ICLR 2024arXiv:2305.15850

citations

#2741

TOP-ERL: Transformer-based Off-Policy Episodic Reinforcement Learning

Ge Li, Dong Tian, Hongyi Zhou et al.

ICLR 2025oralarXiv:2410.09536

citations

#2742

Exact Byte-Level Probabilities from Tokenized Language Models for FIM-Tasks and Model Ensembles

Buu Phan, Brandon Amos, Itai Gat et al.

ICLR 2025arXiv:2410.09303

citations

#2743

Probe Pruning: Accelerating LLMs through Dynamic Pruning via Model-Probing

Qi Le, Enmao Diao, Ziyan Wang et al.

ICLR 2025arXiv:2502.15618

citations

#2744

Learning Implicit Representation for Reconstructing Articulated Objects

Hao Zhang, Fang Li, Samyak Rawlekar et al.

ICLR 2024arXiv:2401.08809

citations

#2745

X-Fi: A Modality-Invariant Foundation Model for Multimodal Human Sensing

Xinyan Chen, Jianfei Yang

ICLR 2025arXiv:2410.10167

citations

#2746

Sports-Traj: A Unified Trajectory Generation Model for Multi-Agent Movement in Sports

Yi Xu, Yun Fu

ICLR 2025oralarXiv:2405.17680

citations

#2747

Fast training and sampling of Restricted Boltzmann Machines

Nicolas BEREUX, Aurélien Decelle, Cyril Furtlehner et al.

ICLR 2025arXiv:2405.15376

citations

#2748

Open-World Reinforcement Learning over Long Short-Term Imagination

Jiajian Li, Qi Wang, Yunbo Wang et al.

ICLR 2025arXiv:2410.03618

citations

#2749

Trained Transformer Classifiers Generalize and Exhibit Benign Overfitting In-Context

Spencer Frei, Gal Vardi

ICLR 2025arXiv:2410.01774

citations

#2750

Deep Kernel Relative Test for Machine-generated Text Detection

Yiliao Song, Zhenqiao Yuan, Shuhai Zhang et al.

ICLR 2025

citations

#2751

Multi-domain Distribution Learning for De Novo Drug Design

Arne Schneuing, Ilia Igashov, Adrian Dobbelstein et al.

ICLR 2025arXiv:2508.17815

citations

#2752

Have the VLMs Lost Confidence? A Study of Sycophancy in VLMs

Shuo Li, Tao Ji, Xiaoran Fan et al.

ICLR 2025arXiv:2410.11302

citations

#2753

Training Nonlinear Transformers for Chain-of-Thought Inference: A Theoretical Generalization Analysis

Hongkang Li, Songtao Lu, Pin-Yu Chen et al.

ICLR 2025arXiv:2410.02167

citations

#2754

Optimized Multi-Token Joint Decoding With Auxiliary Model for LLM Inference

Zongyue Qin, Ziniu Hu, Zifan He et al.

ICLR 2025arXiv:2407.09722

citations

#2755

Critical Learning Periods Emerge Even in Deep Linear Networks

Michael Kleinman, Alessandro Achille, Stefano Soatto

ICLR 2024spotlightarXiv:2308.12221

citations

#2756

PhyMPGN: Physics-encoded Message Passing Graph Network for spatiotemporal PDE systems

Bocheng Zeng, Qi Wang, Mengtao Yan et al.

ICLR 2025oralarXiv:2410.01337

citations

#2757

Glad: A Streaming Scene Generator for Autonomous Driving

Bin Xie, Yingfei Liu, Tiancai Wang et al.

ICLR 2025oralarXiv:2503.00045

citations

#2758

DyST: Towards Dynamic Neural Scene Representations on Real-World Videos

Maximilian Seitzer, Sjoerd van Steenkiste, Thomas Kipf et al.

ICLR 2024spotlightarXiv:2310.06020

citations

#2759

VCR: A Task for Pixel-Level Complex Reasoning in Vision Language Models via Restoring Occluded Text

Tianyu Zhang, Suyuchen Wang, Lu Li et al.

ICLR 2025arXiv:2406.06462

citations

#2760

Internal Cross-layer Gradients for Extending Homogeneity to Heterogeneity in Federated Learning

Yun-Hin Chan, Rui Zhou, Running Zhao et al.

ICLR 2024spotlightarXiv:2308.11464

citations

#2761

Neural Sampling from Boltzmann Densities: Fisher-Rao Curves in the Wasserstein Geometry

Jannis Chemseddine, Christian Wald, Richard Duong et al.

ICLR 2025arXiv:2410.03282

citations

#2762

Hindsight PRIORs for Reward Learning from Human Preferences

Mudit Verma, Katherine Metcalf

ICLR 2024arXiv:2404.08828

citations

#2763

Towards Optimal Multi-draft Speculative Decoding

Zhengmian Hu, Tong Zheng, Vignesh Viswanathan et al.

ICLR 2025arXiv:2502.18779

citations

#2764

Manifold Diffusion Fields

Ahmed Elhag, Ahmed Elhag, Yuyang Wang et al.

ICLR 2024arXiv:2305.15586

citations

#2765

XLand-100B: A Large-Scale Multi-Task Dataset for In-Context Reinforcement Learning

Alexander Nikulin, Ilya Zisman, Alexey Zemtsov et al.

ICLR 2025arXiv:2406.08973

citations

#2766

Aligning Human Motion Generation with Human Perceptions

Haoru Wang, Wentao Zhu, Luyi Miao et al.

ICLR 2025arXiv:2407.02272

citations

#2767

Lossy Compression with Pretrained Diffusion Models

jeremy vonderfecht, Feng Liu

ICLR 2025arXiv:2501.09815

citations

#2768

Fragment and Geometry Aware Tokenization of Molecules for Structure-Based Drug Design Using Language Models

Cong Fu, Xiner Li, Blake Olson et al.

ICLR 2025arXiv:2408.09730

citations

#2769

Analysis of Linear Mode Connectivity via Permutation-Based Weight Matching: With Insights into Other Permutation Search Methods

Akira Ito, Masanori Yamada, Atsutoshi Kumagai

ICLR 2025arXiv:2402.04051

citations

#2770

RelitLRM: Generative Relightable Radiance for Large Reconstruction Models

Tianyuan Zhang, Zhengfei Kuang, Haian Jin et al.

ICLR 2025arXiv:2410.06231

citations

#2771

Addax: Utilizing Zeroth-Order Gradients to Improve Memory Efficiency and Performance of SGD for Fine-Tuning Language Models

Zeman Li, Xinwei Zhang, Peilin Zhong et al.

ICLR 2025arXiv:2410.06441

citations

#2772

A Symmetry-Aware Exploration of Bayesian Neural Network Posteriors

Olivier Laurent, Emanuel Aldea, Gianni Franchi

ICLR 2024arXiv:2310.08287

citations

#2773

Hiding in Plain Sight: Disguising Data Stealing Attacks in Federated Learning

Kostadin Garov, Dimitar I. Dimitrov, Nikola Jovanović et al.

ICLR 2024arXiv:2306.03013

citations

#2774

Symphony: Symmetry-Equivariant Point-Centered Spherical Harmonics for 3D Molecule Generation

Ameya Daigavane, Song Eun Kim, Mario Geiger et al.

ICLR 2024arXiv:2311.16199

citations

#2775

HyperFace: Generating Synthetic Face Recognition Datasets by Exploring Face Embedding Hypersphere

Hatef Otroshi Shahreza, Sébastien Marcel

ICLR 2025arXiv:2411.08470

citations

#2776

Beyond Graphs: Can Large Language Models Comprehend Hypergraphs?

Yifan Feng, Chengwu Yang, Xingliang Hou et al.

ICLR 2025arXiv:2410.10083

citations

#2777

Dynamic Layer Tying for Parameter-Efficient Transformers

Tamir David-Hay, Lior Wolf

ICLR 2024

citations

#2778

Asymptotically Free Sketched Ridge Ensembles: Risks, Cross-Validation, and Tuning

Pratik Patil, Daniel LeJeune

ICLR 2024spotlightarXiv:2310.04357

citations

#2779

Efficient-3Dim: Learning a Generalizable Single-image Novel-view Synthesizer in One Day

Yifan Jiang, Hao Tang, Jen-Hao Chang et al.

ICLR 2024arXiv:2310.03015

citations

#2780

Attention layers provably solve single-location regression

Pierre Marion, Raphaël Berthier, Gérard Biau et al.

ICLR 2025arXiv:2410.01537

citations

#2781

Jailbreaking as a Reward Misspecification Problem

Zhihui Xie, Jiahui Gao, Lei Li et al.

ICLR 2025arXiv:2406.14393

citations

#2782

COSA: Concatenated Sample Pretrained Vision-Language Foundation Model

Sihan Chen, Xingjian He, Handong Li et al.

ICLR 2024oralarXiv:2306.09085

citations

#2783

Towards Robust Out-of-Distribution Generalization Bounds via Sharpness

Yingtian Zou, Kenji Kawaguchi, Yingnan Liu et al.

ICLR 2024spotlightarXiv:2403.06392

citations

#2784

TEASER: Token Enhanced Spatial Modeling for Expressions Reconstruction

Yunfei Liu, Lei Zhu, Lijian Lin et al.

ICLR 2025arXiv:2502.10982

citations

#2785

A Graph is Worth 1-bit Spikes: When Graph Contrastive Learning Meets Spiking Neural Networks

Jintang Li, Huizhe Zhang, Ruofan Wu et al.

ICLR 2024arXiv:2305.19306

citations

#2786

SEA: Sparse Linear Attention with Estimated Attention Mask

Heejun Lee, Jina Kim, Jeff Willette et al.

ICLR 2024arXiv:2310.01777

citations

#2787

Sharpness-Aware Minimization Efficiently Selects Flatter Minima Late In Training

Zhanpeng Zhou, Mingze Wang, Yuchen Mao et al.

ICLR 2025arXiv:2410.10373

citations

#2788

Statistical Advantages of Perturbing Cosine Router in Mixture of Experts

Huy Nguyen, Pedram Akbarian Saravi, Trang Pham et al.

ICLR 2025arXiv:2405.14131

citations

#2789

CrIBo: Self-Supervised Learning via Cross-Image Object-Level Bootstrapping

Tim Lebailly, Thomas Stegmüller, Behzad Bozorgtabar et al.

ICLR 2024spotlightarXiv:2310.07855

citations

#2790

Locality Alignment Improves Vision-Language Models

Ian Covert, Tony Sun, James Y Zou et al.

ICLR 2025arXiv:2410.11087

citations

#2791

Almost Optimal Batch-Regret Tradeoff for Batch Linear Contextual Bandits

Zihan Zhang, Xiangyang Ji, Yuan Zhou

ICLR 2025arXiv:2110.08057

citations

#2792

Butterfly Effects of SGD Noise: Error Amplification in Behavior Cloning and Autoregression

Adam Block, Dylan Foster, Akshay Krishnamurthy et al.

ICLR 2024arXiv:2310.11428

citations

#2793

Efficiently Democratizing Medical LLMs for 50 Languages via a Mixture of Language Family Experts

Guorui Zheng, Xidong Wang, Juhao Liang et al.

ICLR 2025arXiv:2410.10626

citations

#2794

h4rm3l: A Language for Composable Jailbreak Attack Synthesis

Moussa Koulako Bala Doumbouya, Ananjan Nandi, Gabriel Poesia et al.

ICLR 2025arXiv:2408.04811

citations

#2795

6DGS: Enhanced Direction-Aware Gaussian Splatting for Volumetric Rendering

Zhongpai Gao, Benjamin Planche, Meng Zheng et al.

ICLR 2025arXiv:2410.04974

citations

#2796

On the Power of the Weisfeiler-Leman Test for Graph Motif Parameters

Matthias Lanzinger, Pablo Barcelo

ICLR 2024arXiv:2309.17053

citations

#2797

Sharpness-Aware Minimization Enhances Feature Quality via Balanced Learning

Jacob Springer, Vaishnavh Nagarajan, Aditi Raghunathan

ICLR 2024arXiv:2405.20439

citations

#2798

BlendRL: A Framework for Merging Symbolic and Neural Policy Learning

Hikaru Shindo, Quentin Delfosse, Devendra Singh Dhami et al.

ICLR 2025arXiv:2410.11689

citations

#2799

Robust Gymnasium: A Unified Modular Benchmark for Robust Reinforcement Learning

Shangding Gu, Laixi Shi, Muning Wen et al.

ICLR 2025arXiv:2502.19652

citations

#2800

Lightweight Neural App Control

Filippos Christianos, Georgios Papoudakis, Thomas Coste et al.

ICLR 2025arXiv:2410.17883

citations

← Previous

1...12 13 14 15 16...31