Model Calibration

NeurIPS 2025arXiv:2505.14489

#2

Smooth ECE: Principled Reliability Diagrams via Kernel Smoothing

Jaroslaw Blasiok, Preetum Nakkiran

Reasoning Models Better Express Their Confidence

Dongkeun Yoon, Seungone Kim, Sohee Yang et al.

confidence calibrationchain-of-thought reasoninglarge language modelsslow thinking behaviors+2

30

ICML 2025arXiv:2405.08719

#4

Addressing Misspecification in Simulation-based Inference through Data-driven Calibration

Antoine Wehenkel, Juan L. Gamella, Ozan Sener et al.

23

CVPR 2024arXiv:2312.15297

#5

Make Me a BNN: A Simple Strategy for Estimating Bayesian Uncertainty from Pre-trained Models

Gianni Franchi, Olivier Laurent, Maxence Leguéry et al.

15

NeurIPS 2025arXiv:2508.18847

#6

ConfTuner: Training Large Language Models to Express Their Confidence Verbally

Yibo Li, Miao Xiong, Jiaying Wu et al.

confidence calibrationverbalized uncertaintylarge language modelsproper scoring rules+4

10

ICML 2025arXiv:2402.05806

#7

On Temperature Scaling and Conformal Prediction of Deep Classifiers

Lahav Dabah, Tom Tirer

9

NeurIPS 2025arXiv:2502.16387

#8

Simultaneous Swap Regret Minimization via KL-Calibration

Haipeng Luo, Spandan Senapati, Vatsal Sharan

swap regret minimizationkl-calibrationcalibration measuresproper loss functions+3

6

CVPR 2024arXiv:2404.10124

#9

Epistemic Uncertainty Quantification For Pre-Trained Neural Networks

Hanjing Wang, Qiang Ji

6

AAAI 2025arXiv:2410.19796

#10

Feature Clipping for Uncertainty Calibration

Linwei Tao, Minjing Dong, Chang Xu

5

ICLR 2025arXiv:2410.06615

#11

QA-Calibration of Language Model Confidence Scores

Putra Manggala, Atalanti A Mastakouri, Elke Kirschbaum et al.

5

ICCV 2025arXiv:2503.12701

#12

AnyCalib: On-Manifold Learning for Model-Agnostic Single-View Camera Calibration

Javier Tirado-Garín, Javier Civera

camera calibrationsingle-view calibrationmodel-agnostic calibrationintrinsic parameter estimation+4

5

ICML 2025arXiv:2502.05676

#13

Generalized Venn and Venn-Abers Calibration with Applications in Conformal Prediction

Lars van der Laan, Ahmed Alaa

4

ICLR 2025arXiv:2403.02998

#14

Unlocking the Potential of Model Calibration in Federated Learning

Yun-Wei Chu, Dong-Jun Han, Seyyedali Hosseinalipour et al.

Towards Calibrated Deep Clustering Network

Yuheng Jia, Jianhong Cheng, Hui LIU et al.

3

ICLR 2025arXiv:2502.06351

#16

Calibrating LLMs with Information-Theoretic Evidential Deep Learning

Yawei Li, David Rügamer, Bernd Bischl et al.

3

ICML 2025arXiv:2508.00264

#17

Discretization-free Multicalibration through Loss Minimization over Tree Ensembles

Hongyi Henry Jin, Zijun Ding, Dung Daniel Ngo et al.

Calibrated Language Models and How to Find Them with Label Smoothing

Jerry Huang, Peng Lu, QIUHAO Zeng

2

ICML 2025arXiv:2504.13548

#19

Beyond One-Hot Labels: Semantic Mixing for Model Calibration

Haoyang Luo, Linwei Tao, Minjing Dong et al.

2

ICLR 2024arXiv:2311.11723

#20

Leveraging Uncertainty Estimates To Improve Classifier Performance

Gundeep Arora, Srujana Merugu, Anoop Saladi et al.

AAAI 2025arXiv:2412.10658

#21

Model Uncertainty Quantification by Conformal Prediction in Continual Learning

Rui Gao, Weiwei Liu

Combining Priors with Experience: Confidence Calibration Based on Binomial Process Modeling

Jinzong Dong, Zhaohui Jiang, Dong Pan et al.

AAAI 2025arXiv:2412.20170

#23

Real-Time Calibration Model for Low-Cost Sensor in Fine-Grained Time Series

Seokho Ahn, Hyungjin Kim, Sungbok Shin et al.

AAAI 2024arXiv:2401.12001

#24

Modeling Stereo-Confidence out of the End-to-End Stereo-Matching Network via Disparity Plane Sweep

Jae Young Lee, Woonghyun Ka, Jaehyun Choi et al.

stereo confidencedisparity plane sweepstereo matching networkscost volume+3

ICCV 2025arXiv:2408.06079

#25

Towards Adversarial Robustness via Debiased High-Confidence Logit Alignment

Kejia Zhang, Juanjuan Weng, Zhiming Luo et al.

NeurIPS 2025arXiv:2505.16636

#26

Multivariate Latent Recalibration for Conditional Normalizing Flows

Victor Dheur, Souhaib Ben Taieb

conditional normalizing flowsmultivariate density estimationmodel recalibrationlatent calibration+4

NeurIPS 2025arXiv:2506.18283

#27

Quantifying Uncertainty in the Presence of Distribution Shifts

Yuli Slavutsky, David Blei

uncertainty estimationcovariate shiftbayesian frameworkadaptive prior+3

NeurIPS 2025arXiv:2510.26026

#28

Your Pre-trained LLM is Secretly an Unsupervised Confidence Calibrator

Beier Luo, Shuoyuan Wang, Sharon Li et al.

Conformal Prediction Beyond the Horizon: Distribution-Free Inference for Policy Evaluation

Feichen Gan, Lu Youcun, Yingying Zhang et al.

conformal predictionpolicy evaluationreinforcement learninguncertainty quantification+4

ICLR 2025arXiv:2410.04315

#30

Taming Overconfidence in LLMs: Reward Calibration in RLHF

Jixuan Leng, Chengsong Huang, Banghua Zhu et al.

Calibrating Expressions of Certainty

Peiqi Wang, Barbara Lam, Yingcheng Liu et al.

certainty calibrationlinguistic expressionsuncertainty distributionspost-hoc calibration+3

NeurIPS 2025arXiv:2505.24097

#32

Performative Risk Control: Calibrating Models for Reliable Deployment under Performativity

Victor Li, Baiting Chen, Yuzhen Mao et al.

risk controlperformative predictionsmodel calibrationstrategic manipulation+3

NeurIPS 2025arXiv:2511.10439

#33

Improving Perturbation-based Explanations by Understanding the Role of Uncertainty Calibration

Thomas Decker, Volker Tresp, Florian Buettner

NeurIPS 2025arXiv:2503.02863

#34

SteerConf: Steering LLMs for Confidence Elicitation

Ziang Zhou, Tianyuan Jin, Jieming Shi et al.

confidence elicitationmodel calibrationsteering prompt strategyconfidence consistency+3

NeurIPS 2025arXiv:2502.19110

#35

On Calibration of LLM-based Guard Models for Reliable Content Moderation

Hongfu Liu, Hengguan Huang, Xiangming Gu et al.

Conformal Linguistic Calibration: Trading-off between Factuality and Specificity

Zhengping Jiang, Anqi Liu, Ben Van Durme

linguistic calibrationuncertainty quantificationconformal predictionanswer set prediction+3

NeurIPS 2025arXiv:2506.09338

#37

Understanding Model Calibration - A gentle introduction and visual exploration of calibration and the expected calibration error (ECE)

Maja Pavlovic

Know What You Don't Know: Uncertainty Calibration of Process Reward Models

Young-Jin Park, Kristjan Greenewald, Kaveh Alimohammadi et al.

uncertainty calibrationprocess reward modelsquantile regressioninstance-adaptive scaling+4

NeurIPS 2025arXiv:2502.15131

#39

On Calibration of Object Detectors: Pitfalls, Evaluation and Baselines

Selim Kuzucu, Kemal Oksuz, Jonathan Sadeghi et al.

Provable Uncertainty Decomposition via Higher-Order Calibration

Gustaf Ahdritz, Aravind Gollakota, Parikshit Gopalan et al.

Aligning Evaluation with Clinical Priorities: Calibration, Label Shift, and Error Costs

Gerardo Flores, Alyssa H. Smith, Julia Fukuyama et al.

Quantifying Uncertainty in Error Consistency: Towards Reliable Behavioral Comparison of Classifiers

Thomas Klein, Sascha Meyen, Wieland Brendel et al.

Approximating Full Conformal Prediction for Neural Network Regression with Gauss-Newton Influence

Dharmesh Tailor, Alvaro Correia, Eric Nalisnick et al.

Towards Unbiased Calibration using Meta-Regularization

Jacek Golebiowski, Cheng Wang

Optimal and Provable Calibration in High-Dimensional Binary Classification: Angular Calibration and Platt Scaling

Yufan Li, Pragya Sur

binary classificationcalibration theoryhigh-dimensional statisticsbregman divergence+4

AAAI 2025arXiv:2502.14698

#46

General Uncertainty Estimation with Delta Variances

Simon Schmitt, John Shawe-Taylor, Hado van Hasselt

AAAI 2024arXiv:2312.09817

#47

Reassessing How to Compare and Improve the Calibration of Machine Learning Models

Muthu Chidambaram, Rong Ge

Dirichlet-Based Prediction Calibration for Learning with Noisy Labels

Chen-Chen Zong, Ye-Wen Wang, Ming-Kun Xie et al.

Catalyst for Clustering-Based Unsupervised Object Re-identification: Feature Calibration

Huafeng Li, Qingsong Hu, Zhanxuan Hu

On the Asymptotic Optimality of Confidence Interval Based Algorithms for Fixed Confidence MABs

Kushal Kejriwal, Nikhil Karamchandani, Jayakrishnan Nair

Calibrated One Round Federated Learning with Bayesian Inference in the Predictive Space

Mohsin Hasan, Guojun Zhang, Kaiyang Guo et al.

ICLR 2025arXiv:2405.13922

#52

Intelligent Calibration for Bias Reduction in Sentiment Corpora Annotation Process

Idan Toker, David Sarne, Jonathan Schler

Towards Certification of Uncertainty Calibration under Adversarial Attacks

Cornelius Emde, Francesco Pinto, Thomas Lukasiewicz et al.

uncertainty calibrationadversarial attackscertification methodsmodel calibration+3

AAAI 2025arXiv:2408.10939

#54

Generative Calibration of Inaccurate Annotation for Label Distribution Learning

Liang He, Yunan Lu, Weiwei Li et al.

Attack-inspired Calibration Loss for Calibrating Crack Recognition

Zhuangzhuang Chen, Qiangyu Chen, Jiahao Zhang et al.

CLIB-FIQA: Face Image Quality Assessment with Confidence Calibration

Fu-Zhao Ou, Chongyi Li, Shiqi Wang et al.

Improving Model Probability Calibration by Integration of Large Data Sources with Biased Labels

Renat Sergazinov, Richard Chen, Cheng Ji et al.

Conformalized Interval Arithmetic with Symmetric Calibration

Rui Luo, Zhixin Zhou

#59

Parametric ρ-Norm Scaling Calibration

Siyuan Zhang, Linbo Xie

Inlier Confidence Calibration for Point Cloud Registration

Yongzhe Yuan, Yue Wu, Xiaolong Fan et al.

Self-Calibrating Vicinal Risk Minimisation for Model Calibration

Jiawei Liu, Changkun Ye, Ruikai Cui et al.

Calibration Bottleneck: Over-compressed Representations are Less Calibratable

Deng-Bao Wang, Min-Ling Zhang

uncertainty calibrationmodel calibratabilitypost-hoc calibrationweight decay regularizer+3

ICML 2025arXiv:2502.03023

#63

Parametric Scaling Law of Tuning Bias in Conformal Prediction

Hao Zeng, Kangdao Liu, Bingyi Jing et al.

#64

How Flawed Is ECE? An Analysis via Logit Smoothing

Muthu Chidambaram, Holden Lee, Colin McSwiggen et al.

model calibrationexpected calibration errormiscalibration metriclogit smoothing+4

ICML 2025arXiv:2502.16336

#65

Rectifying Conformity Scores for Better Conditional Coverage

Vincent Plassier, Alexander Fishkov, Victor Dheur et al.

ICLR 2024arXiv:2307.02245

#66

Set Learning for Accurate and Calibrated Models

Lukas Muttenthaler, Robert A Vandermeulen, Qiuyi (Richard) Zhang et al.

#67

Linguistic Calibration of Long-Form Generations

Neil Band, Xuechen Li, Tengyu Ma et al.

linguistic calibrationlong-form generationconfidence statementsdecision-making+3

ICML 2025arXiv:2410.02681

#68

Pointwise Information Measures as Confidence Estimators in Deep Neural Networks: A Comparative Study

Shelvia Wongso, Rohan Ghosh, Mehul Motani

Understanding and Mitigating Miscalibration in Prompt Tuning for Vision-Language Models

Shuoyuan Wang, Sharon Li, Hongxin Wei

ICML 2025arXiv:2512.09054

#70

Improving Multi-Class Calibration through Normalization-Aware Isotonic Techniques

Alon Arad, Saharon Rosset

CVPR 2024arXiv:2405.05605

#71

Minimal Perspective Autocalibration

Andrea Porfiri Dal Cin, Timothy Duff, Luca Magri et al.

CVPR 2024arXiv:2403.04583

#72

Unbiased Estimator for Distorted Conics in Camera Calibration

Chaehyeon Song, Jaeho Shin, Myung-Hwan Jeon et al.

ICML 2025arXiv:2406.06227

#73

PAC-Bayes Analysis for Recalibration in Classification

Masahiro Fujisawa, Futoshi Futami

#74

T-Cal: An Optimal Test for the Calibration of Predictive Models

Donghwan Lee, Xinmeng Huang, Hamed Hassani et al.

predictive model calibrationuncertainty quantificationhypothesis testingexpected calibration error+4

ICML 2025arXiv:2503.01495

#75

Learning model uncertainty as variance-minimizing instance weights

Nishant Jain, Karthikeyan Shanmugam, Pradeep Shenoy

Improving the Statistical Efficiency of Cross-Conformal Prediction

ICLR 2024arXiv:2306.13063

#77

Can LLMs Express Their Uncertainty? An Empirical Evaluation of Confidence Elicitation in LLMs

Miao Xiong, Zhiyuan Hu, Xinyang Lu et al.

ICML 2024arXiv:2404.04689

#78

Uncertainty Quantification for LLM-Based Survey Simulations

Chengpiao Huang, Yuhang Wu, Kaizheng Wang

Multicalibration for Confidence Scoring in LLMs

Gianluca Detommaso, Martin A Bertran, Riccardo Fogliato et al.

confidence scoringmulticalibrationlarge language modelscalibration methods+4

#80

Enhancing Post-training Quantization Calibration through Contrastive Learning

Yuzhang Shang, Gaowen Liu, Ramana Kompella et al.

Algorithms with Calibrated Machine Learning Predictions

Judy Hanwen Shen, Ellen Vitercik, Anders Wikum

Experts Don't Cheat: Learning What You Don't Know By Predicting Pairs

Daniel D. Johnson, Daniel Tarlow, David Duvenaud et al.

epistemic uncertainty quantificationsecond-order calibrationconditional distribution predictionhallucination detection+2

ICLR 2024arXiv:2310.19208

#83

LitCab: Lightweight Language Model Calibration over Short- and Long-form Responses

Xin Liu, Muhammad Khalifa, Lu Wang

ICML 2024arXiv:2405.15458

#84

FedCal: Achieving Local and Global Calibration in Federated Learning via Aggregated Parameterized Scaler

Hongyi Peng, Han Yu, Xiaoli Tang et al.

federated learningmodel calibrationdata heterogeneitynon-iid data+4

#85

An Empirical Study Into What Matters for Calibrating Vision-Language Models

Weijie Tu, Weijian Deng, Dylan Campbell et al.

vision-language modelsuncertainty estimationmodel calibrationtemperature scaling+3

ICML 2024arXiv:2311.17105

#86

On the Calibration of Human Pose Estimation

Kerui Gu, Rongyu Chen, Xuanlong Yu et al.

human pose estimationconfidence calibrationkeypoint localizationheatmap analysis+3

ICML 2024arXiv:2402.04655

#87

Open-Vocabulary Calibration for Fine-tuned CLIP

Shuoyuan Wang, Jindong Wang, Guoqing Wang et al.

vision-language modelsopen-vocabulary tasksconfidence calibrationparameter-efficient fine-tuning+3

#88

Tilt and Average : Geometric Adjustment of the Last Layer for Recalibration

Gyusang Cho, Chan-Hyun Youn

neural network calibrationconfidence alignmentlast layer adjustmentgeometric adjustment+2

#89

Sampling-based Multi-dimensional Recalibration

Youngseog Chung, Ian Char, Jeff Schneider

probabilistic forecast calibrationmulti-dimensional regressionsample-based uncertaintyhighest density regions+4

ICML 2024arXiv:2405.07374

#90

Conformalized Survival Distributions: A Generic Post-Process to Increase Calibration

Shi-ang Qi, Yakun Yu, Russell Greiner

survival analysismodel calibrationdiscrimination performanceconformal regression+2

ECCV 2024arXiv:2403.07263

#91

Confidence Self-Calibration for Multi-Label Class-Incremental Learning

Kaile Du, Yifan Zhou, Fan Lyu et al.

Uncertainty Calibration with Energy Based Instance-wise Scaling in the Wild Dataset

Mijoo Kim, Junseok Kwon

Instant Uncertainty Calibration of NeRFs Using a Meta-Calibrator

Niki Amini-Naieni, Tomas Jakab, Andrea Vedaldi et al.

Adaptive Bounding Box Uncertainties via Two-Step Conformal Prediction

Alexander Timans, Christoph-Nikolas Straehle, Kaspar Sakmann et al.

conformal predictionuncertainty quantificationobject detectionbounding box localization+4

ICCV 2025arXiv:2509.26231

#95

IMG: Calibrating Diffusion Models via Implicit Multimodal Guidance

Jiayi Guo, Chuanhao Yan, Xingqian Xu et al.

diffusion model alignmentmultimodal guidanceimage-text alignmentpreference optimization+3

CVPR 2025arXiv:2503.22725

#96

Improving Accuracy and Calibration via Differentiated Deep Mutual Learning

Han Liu, Peng Cui, Bingning Wang et al.

Calibrating MLLM-as-a-judge via Multimodal Bayesian Prompt Ensembles

Eric Slyman, Mehrab Tanjim, Kushal Kafle et al.

CaliMatch: Adaptive Calibration for Improving Safe Semi-supervised Learning

Jinsoo Bae, Seoung Bum Kim, Hyungrok Do

Uncertainty Weighted Gradients for Model Calibration

Jinxu Lin, Linwei Tao, Minjing Dong et al.

model calibrationuncertainty estimationloss functionsgradient weighting+4

#100

Deterministic Object Pose Confidence Region Estimation

Jinghao Wang, Zhang Li, Zi Wang et al.

ICCV 2025