Most Cited 2025 "safety benchmarks" Papers

22,274 papers found • Page 112 of 112

Filters:Most Cited 2025 safety benchmarks Clear all

Conference

AAAI 2025 (3,028)COLM 2025 (418)CVPR 2025 (2,873)ICCV 2025 (2,701)ICLR 2025 (3,827)ICML 2025 (3,340)ISMAR 2025 (229)NEURIPS 2025 (5,858)AAAI 2024 (2,289)CVPR 2024 (2,716)ECCV 2024 (2,387)ICLR 2024 (2,297)ICML 2024 (2,635)

Paper Type

poster (24,624)paper (8,558)oral (1,594)spotlight (1,421)highlight (975)

#22201

Continuous Bayesian Model Selection for Multivariate Causal Discovery

Anish Dhir, Ruby Sedgwick, Avinash Kori et al.

ICML 2025posterarXiv:2411.10154

#22202

Pretraining Generative Flow Networks with Inexpensive Rewards for Molecular Graph Generation

Mohit Pandey, Gopeshh Subbaraj, Artem Cherkasov et al.

ICML 2025posterarXiv:2503.06337

#22203

Visual Attention Never Fades: Selective Progressive Attention ReCalibration for Detailed Image Captioning in Multimodal Large Language Models

Mingi Jung, Saehyung Lee, Eunji Kim et al.

ICML 2025posterarXiv:2502.01419

#22204

Text-to-LoRA: Instant Transformer Adaption

Rujikorn Charakorn, Edoardo Cetin, Yujin Tang et al.

ICML 2025posterarXiv:2506.06105

#22205

On the Tension between Byzantine Robustness and No-Attack Accuracy in Distributed Learning

Yi-Rui Yang, Chang-Wei Shi, Wu-Jun Li

ICML 2025spotlight

#22206

Can Large Language Models Understand Intermediate Representations in Compilers?

Hailong Jiang, Jianfeng Zhu, Yao Wan et al.

ICML 2025posterarXiv:2502.06854

#22207

Editable Noise Map Inversion: Encoding Target-image into Noise For High-Fidelity Image Manipulation

Mingyu Kang, Yong Suk Choi

ICML 2025oralarXiv:2509.25776

#22208

Learnware Specification via Dual Alignment

Wei Chen, Jun-Xiang Mao, Xiaozheng Wang et al.

ICML 2025poster

#22209

On the Importance of Gaussianizing Representations

Daniel Eftekhari, Vardan Papyan

ICML 2025posterarXiv:2505.00685

#22210

CodeSync: Synchronizing Large Language Models with Dynamic Code Evolution at Scale

Chenlong Wang, Zhaoyang Chu, Zhengxiang Cheng et al.

ICML 2025posterarXiv:2502.16645

#22211

Adversarial Inception Backdoor Attacks against Reinforcement Learning

Ethan Rathbun, Alina Oprea, Christopher Amato

ICML 2025posterarXiv:2410.13995

#22212

Gradient Flow Provably Learns Robust Classifiers for Orthonormal GMMs

Hancheng Min, Rene Vidal

ICML 2025poster

#22213

The underlying structures of self-attention: symmetry, directionality, and emergent dynamics in Transformer training

Matteo Saponati, Pascal J. Sager, Pau Vilimelis Aceituno et al.

ICML 2025posterarXiv:2502.10927

#22214

Novelty Detection in Reinforcement Learning with World Models

Geigh Zollicoffer, Kenneth Eaton, Jonathan Balloch et al.

ICML 2025spotlightarXiv:2310.08731

#22215

Relational Invariant Learning for Robust Solvation Free Energy Prediction

Yeyun Chen

ICML 2025spotlight

#22216

Unconstrained Robust Online Convex Optimization

Jiujia Zhang, Ashok Cutkosky

ICML 2025posterarXiv:2506.12781

#22217

The Hidden Dimensions of LLM Alignment: A Multi-Dimensional Analysis of Orthogonal Safety Directions

Wenbo Pan, Zhichao Liu, Qiguang Chen et al.

ICML 2025posterarXiv:2502.09674

#22218

Outlier-Aware Post-Training Quantization for Discrete Graph Diffusion Models

Zheng Gong, Ying Sun

ICML 2025poster

#22219

ReverB-SNN: Reversing Bit of the Weight and Activation for Spiking Neural Networks

Yufei Guo, Yuhan Zhang, Zhou Jie et al.

ICML 2025posterarXiv:2506.07720

#22220

Scaling Laws for Forgetting during Finetuning with Pretraining Data Injection

Louis Béthune, David Grangier, Dan Busbridge et al.

ICML 2025poster

#22221

Relative Error Fair Clustering in the Weak-Strong Oracle Model

Vladimir Braverman, Prathamesh Dharangutte, Shaofeng Jiang et al.

ICML 2025posterarXiv:2506.12287

#22222

Doubly Protected Estimation for Survival Outcomes Utilizing External Controls for Randomized Clinical Trials

Chenyin Gao, Shu Yang, Mingyang Shan et al.

ICML 2025posterarXiv:2410.18409

#22223

Outlier Gradient Analysis: Efficiently Identifying Detrimental Training Samples for Deep Learning Models

Anshuman Chhabra, Bo Li, Jian Chen et al.

ICML 2025oralarXiv:2405.03869

#22224

BaWA: Automatic Optimizing Pruning Metric for Large Language Models with Balanced Weight and Activation

Lian Liu, Xiandong Zhao, Guanchen Li et al.

ICML 2025poster

#22225

Geometric Contact Flows: Contactomorphisms for Dynamics and Control

Andrea Testa, Søren Hauberg, Tamim Asfour et al.

ICML 2025posterarXiv:2506.17868

#22226

Neural Genetic Search in Discrete Spaces

Hyeonah Kim, Sanghyeok Choi, Jiwoo Son et al.

ICML 2025posterarXiv:2502.10433

#22227

Sparse Video-Gen: Accelerating Video Diffusion Transformers with Spatial-Temporal Sparsity

Haocheng Xi, Shuo Yang, Yilong Zhao et al.

ICML 2025oral

#22228

PieClam: A Universal Graph Autoencoder Based on Overlapping Inclusive and Exclusive Communities

Daniel Zilberg, Ron Levie

ICML 2025posterarXiv:2409.11618

#22229

Efficient Source-free Unlearning via Energy-Guided Data Synthesis and Discrimination-Aware Multitask Optimization

Xiuyuan Wang, Chaochao Chen, Weiming Liu et al.

ICML 2025spotlight

#22230

Ad Hoc Teamwork via Offline Goal-Based Decision Transformers

Xinzhi Zhang, Hoehi Chan, Deheng Ye et al.

ICML 2025poster

#22231

AlphaVerus: Bootstrapping Formally Verified Code Generation through Self-Improving Translation and Treefinement

Pranjal Aggarwal, Bryan Parno, Sean Welleck

ICML 2025posterarXiv:2412.06176

#22232

The Ripple Effect: On Unforeseen Complications of Backdoor Attacks

Rui Zhang, Yun Shen, Hongwei Li et al.

ICML 2025posterarXiv:2505.11586

#22233

A Sharper Global Convergence Analysis for Average Reward Reinforcement Learning via an Actor-Critic Approach

Swetha Ganesh, Washim Mondal, Vaneet Aggarwal

ICML 2025posterarXiv:2407.18878

#22234

Contrastive Localized Language-Image Pre-Training

Hong-You Chen, Zhengfeng Lai, Haotian Zhang et al.

ICML 2025posterarXiv:2410.02746

#22235

Implicit Bias of Gradient Descent for Non-Homogeneous Deep Networks

Yuhang Cai, Kangjie Zhou, Jingfeng Wu et al.

ICML 2025posterarXiv:2502.16075

#22236

Improved and Oracle-Efficient Online $\ell_1$-Multicalibration

Rohan Ghuge, Vidya Muthukumar, Sahil Singla

ICML 2025posterarXiv:2505.17365

#22237

One Diffusion Step to Real-World Super-Resolution via Flow Trajectory Distillation

Jianze Li, Jiezhang Cao, Yong Guo et al.

ICML 2025posterarXiv:2502.01993

#22238

Capturing Temporal Dynamics in Large-Scale Canopy Tree Height Estimation

Jan Pauls, Max Zimmer, Berkant Turan et al.

ICML 2025oralarXiv:2501.19328

#22239

Towards the Efficient Inference by Incorporating Automated Computational Phenotypes under Covariate Shift

chao ying, Jun Jin, Yi Guo et al.

ICML 2025posterarXiv:2505.22632

#22240

A Sample Efficient Conditional Independence Test in the Presence of Discretization

Boyang Sun, Yu Yao, Xinshuai Dong et al.

ICML 2025posterarXiv:2506.08747

#22241

"Why Is There a Tumor?": Tell Me the Reason, Show Me the Evidence

Mengmeng Ma, Tang Li, Yunxiang Peng et al.

ICML 2025poster

#22242

Diverging Preferences: When do Annotators Disagree and do Models Know?

Michael Zhang, Zhilin Wang, Jena Hwang et al.

ICML 2025posterarXiv:2410.14632

#22243

Self-cross Feature based Spiking Neural Networks for Efficient Few-shot Learning

Qi Xu, Junyang Zhu, Dongdong Zhou et al.

ICML 2025oralarXiv:2505.07921

#22244

Active Treatment Effect Estimation via Limited Samples

Zhiheng Zhang, Haoxiang Wang, Haoxuan Li et al.

ICML 2025poster

#22245

Random Policy Evaluation Uncovers Policies of Generative Flow Networks

Haoran He, Emmanuel Bengio, Qingpeng Cai et al.

ICML 2025posterarXiv:2406.02213

#22246

Generalized Category Discovery via Reciprocal Learning and Class-Wise Distribution Regularization

Duo Liu, Zhiquan Tan, Linglan Zhao et al.

ICML 2025posterarXiv:2506.02334

#22247

Inductive Gradient Adjustment for Spectral Bias in Implicit Neural Representations

Kexuan Shi, Hai Chen, Leheng Zhang et al.

ICML 2025posterarXiv:2410.13271

#22248

Learning Efficient Robotic Garment Manipulation with Standardization

zhou changshi, Feng Luan, hujiarui et al.

ICML 2025posterarXiv:2506.22769

#22249

Efficient Heterogeneity-Aware Federated Active Data Selection

Yingpeng Tang, Chao Ren, Xiaoli Tang et al.

ICML 2025poster

#22250

Preconditioned Riemannian Gradient Descent Algorithm for Low-Multilinear-Rank Tensor Completion

Yuanwei Zhang, Fengmiao Bian, Xiaoqun Zhang et al.

ICML 2025poster

#22251

Grammar-Forced Translation of Natural Language to Temporal Logic using LLMs

William English, Dominic Simon, Sumit Jha et al.

ICML 2025oralarXiv:2512.16814

#22252

Equivariant Neural Tangent Kernels

Philipp Misof, Pan Kessel, Jan Gerken

ICML 2025posterarXiv:2406.06504

#22253

Empowering World Models with Reflection for Embodied Video Prediction

Xiaowei Chi, Chun-Kai Fan, Hengyuan Zhang et al.

ICML 2025poster

#22254

LoRA-Gen: Specializing Large Language Model via Online LoRA Generation

Yicheng Xiao, Lin Song, Rui Yang et al.

ICML 2025posterarXiv:2506.11638

#22255

Protein Structure Tokenization: Benchmarking and New Recipe

Xinyu Yuan, Zichen Wang, Marcus Collins et al.

ICML 2025posterarXiv:2503.00089

#22256

How to Move Your Dragon: Text-to-Motion Synthesis for Large-Vocabulary Objects

Wonkwang Lee, Jongwon Jeong, Taehong Moon et al.

ICML 2025posterarXiv:2503.04257

#22257

Efficiently Serving Large Multimodal Models Using EPD Disaggregation

Gursimran Singh, Xinglu Wang, Yifan Hu et al.

ICML 2025posterarXiv:2501.05460

#22258

Tensorized Multi-View Multi-Label Classification via Laplace Tensor Rank

Qiyu Zhong, Yi Shan, Haobo Wang et al.

ICML 2025poster

#22259

Learning to Keep a Promise: Scaling Language Model Decoding Parallelism with Learned Asynchronous Decoding

Tian Jin, Ellie Cheng, Zachary Ankner et al.

ICML 2025posterarXiv:2502.11517

#22260

Learning Multi-Level Features with Matryoshka Sparse Autoencoders

Bart Bussmann, Noa Nabeshima, Adam Karvonen et al.

ICML 2025posterarXiv:2503.17547

#22261

Grokking in the Wild: Data Augmentation for Real-World Multi-Hop Reasoning with Transformers

Roman Abramov, Felix Steinbauer, Gjergji Kasneci

ICML 2025posterarXiv:2504.20752

#22262

Code-Generated Graph Representations Using Multiple LLM Agents for Material Properties Prediction

Jiao Huang, Qianli Xing, Jinglong Ji et al.

ICML 2025poster

#22263

FeatSharp: Your Vision Model Features, Sharper

Mike Ranzinger, Greg Heinrich, Pavlo Molchanov et al.

ICML 2025posterarXiv:2502.16025

#22264

Private Lossless Multiple Release

Joel Daniel Andersson, Lukas Retschmeier, Boel Nelson et al.

ICML 2025posterarXiv:2505.22449

#22265

Disentangling and Integrating Relational and Sensory Information in Transformer Architectures

Awni Altabaa, John Lafferty

ICML 2025posterarXiv:2405.16727

#22266

Rethinking External Slow-Thinking: From Snowball Errors to Probability of Correct Reasoning

Zeyu Gan, Yun Liao, Yong Liu

ICML 2025posterarXiv:2501.15602

#22267

Parameters vs FLOPs: Scaling Laws for Optimal Sparsity for Mixture-of-Experts Language Models

Samira Abnar, Harshay Shah, Dan Busbridge et al.

ICML 2025posterarXiv:2501.12370

#22268

A Reductions Approach to Risk-Sensitive Reinforcement Learning with Optimized Certainty Equivalents

Kaiwen Wang, Dawen Liang, Nathan Kallus et al.

ICML 2025posterarXiv:2403.06323

#22269

LIMEFLDL: A Local Interpretable Model-Agnostic Explanations Approach for Label Distribution Learning

Xiuyi Jia, Jinchi Li, Yunan Lu et al.

ICML 2025poster

#22270

Hardware and Software Platform Inference

Cheng Zhang, Hanna Foerster, Robert Mullins et al.

ICML 2025posterarXiv:2411.05197

#22271

Nonlinearly Preconditioned Gradient Methods under Generalized Smoothness

Konstantinos Oikonomidis, Jan Quan, Emanuel Laude et al.

ICML 2025oralarXiv:2502.08532

#22272

What Limits Bidirectional Model's Generative Capabilities? A Uni-Bi-Directional Mixture-of-Expert Method For Bidirectional Fine-tuning

Zuchao Li, Yonghua Hei, Qiwei Li et al.

ICML 2025poster

#22273

How to Evaluate and Mitigate IP Infringement in Visual Generative AI?

Zhenting Wang, Chen Chen, Vikash Sehwag et al.

ICML 2025poster

#22274

Locate-then-edit for Multi-hop Factual Recall under Knowledge Editing

Zhuoran Zhang, Yongxiang Li, Zijian Kan et al.

ICML 2025posterarXiv:2410.06331

← Previous

1...110 111 112