EvA: Erasing Spurious Correlations with Activations

1citations

Citations

#1934

in ICLR 2025

of 3827 papers

Authors

Data Points

Authors

Qiyuan He Kai Xu Angela Yao

Topics

spurious correlations image classification representation debiasing activation erasing class-specific indicators pretrained networks bias mitigation

Abstract

Spurious correlations often arise when models associate features strongly correlated with, but not causally related to, the label e.g. an image classifier associates bodies of water with ducks. To mitigate spurious correlations, existing methods focus on learning unbiased representation or incorporating additional information about the correlations during training. This work removes spurious correlations by ``ErasingwithActivations'' (EvA). EvA learns class-specific spurious indicator on each channel for the fully connected layer of pretrained networks. By erasing spurious connections during re-weighting, EvA achieves state-of-the-art performance across diverse datasets (6.2\% relative gain on BAR and achieves 4.1\% on Waterbirds). For biased datasets without any information about the spurious correlations, EvA can outperform previous methods (4.8\% relative gain on Waterbirds) with 6 orders of magnitude less compute, highlighting its data and computational efficiency.

Citation History

Jan 26, 2026

Jan 27, 2026

Feb 1, 2026

1+1