🧬Learning Paradigms

Active Learning

Selecting informative samples for labeling

100 papers4,030 total citations

Compare with other topics

Feb '24 — Jan '261034 papers

Top Conferences

ICLR: 28 AAAI: 25 CVPR: 22 ECCV: 12 ICML: 8 NeurIPS: 5

Top Papers

#1

Monkey: Image Resolution and Text Label Are Important Things for Large Multi-modal Models

Zhang Li, Biao Yang, Qiang Liu et al.

OpenChat: Advancing Open-source Language Models with Mixed-Quality Data

Guan Wang, Sijie Cheng, Xianyuan Zhan et al.

AnomalyCLIP: Object-agnostic Prompt Learning for Zero-shot Anomaly Detection

Qihang Zhou, Guansong Pang, Yu Tian et al.

EfficientSAM: Leveraged Masked Image Pretraining for Efficient Segment Anything

Yunyang Xiong, Balakrishnan Varadarajan, Lemeng Wu et al.

Data Filtering Networks

Alex Fang, Albin Madappally Jose, Amit Jain et al.

Demystifying CLIP Data

Hu Xu, Saining Xie, Xiaoqing Tan et al.

ToolACE: Winning the Points of LLM Function Calling

Weiwen Liu, Xu Huang, Xingshan Zeng et al.

Towards Open-ended Visual Quality Comparison

Haoning Wu, Hanwei Zhu, Zicheng Zhang et al.

When Attention Sink Emerges in Language Models: An Empirical View

Xiangming Gu, Tianyu Pang, Chao Du et al.

ICLR 2025arXiv:2410.10781

attention sink phenomenonlanguage model pre-trainingsoftmax normalizationkey biases+4

90

citations

#10

Human Feedback is not Gold Standard

Tom Hosking, Phil Blunsom, Max Bartolo

Text Prompt with Normality Guidance for Weakly Supervised Video Anomaly Detection

Zhiwei Yang, Jing Liu, Peng Wu

On the Learnability of Watermarks for Language Models

Chenchen Gu, XIANG LI, Percy Liang et al.

Attention-Challenging Multiple Instance Learning for Whole Slide Image Classification

Yunlong Zhang, Honglin Li, YUXUAN SUN et al.

Position: The No Free Lunch Theorem, Kolmogorov Complexity, and the Role of Inductive Biases in Machine Learning

Micah Goldblum, Marc Finzi, Keefer Rowan et al.

ICML 2024

no free lunch theoremskolmogorov complexityinductive biasessupervised learning+4

60

citations

#15

LatestEval: Addressing Data Contamination in Language Model Evaluation through Dynamic and Time

Sensitive Test Construction - Yucheng Li, Frank Guerin, Chenghua Lin

AAAI 2024arXiv:2312.12343

data contaminationlanguage model evaluationreading comprehensiondynamic evaluation+4

53

citations

#16

In-Context Learning Learns Label Relationships but Is Not Conventional Learning

Jannik Kossen, Yarin Gal, Tom Rainforth

Magic Tokens: Select Diverse Tokens for Multi-modal Object Re-Identification

Pingping Zhang, Yuhao Wang, Yang Liu et al.

Organize the Web: Constructing Domains Enhances Pre-Training Data Curation

Alexander Wettig, Kyle Lo, Sewon Min et al.

Learning How Hard to Think: Input-Adaptive Allocation of LM Computation

Mehul Damani, Idan Shenfeld, Andi Peng et al.

Debiasing Multimodal Sarcasm Detection with Contrastive Learning

Mengzhao Jia, Can Xie, Liqiang Jing

AAAI 2024arXiv:2312.10493

multimodal sarcasm detectioncontrastive learningout-of-distribution generalizationdebiasing methods+4

43

citations

#21

DLF: Disentangled-Language-Focused Multimodal Sentiment Analysis

Pan Wang, Qiang Zhou, Yawen Wu et al.

Does CLIP’s generalization performance mainly stem from high train-test similarity?

Prasanna Mayilvahanan, Thaddäus Wiedemer, Evgenia Rusak et al.

Better Call SAL: Towards Learning to Segment Anything in Lidar

Aljoša Ošep, Tim Meinhardt, Francesco Ferroni et al.

Prompting Language-Informed Distribution for Compositional Zero-Shot Learning

Wentao Bao, Lichang Chen, Heng Huang et al.

Active Generalized Category Discovery

Shijie Ma, Fei Zhu, Zhun Zhong et al.

AA-CLIP: Enhancing Zero-Shot Anomaly Detection via Anomaly-Aware CLIP

wenxin ma, Xu Zhang, Qingsong Yao et al.

Modeling Future Conversation Turns to Teach LLMs to Ask Clarifying Questions

Michael Zhang, W. Bradley Knox, Eunsol Choi

Spot the Fake: Large Multimodal Model-Based Synthetic Image Detection with Artifact Explanation

Siwei Wen, junyan ye, Peilin Feng et al.

Entropic Open-Set Active Learning

Bardia Safaei, Vibashan VS, Celso de Melo et al.

AAAI 2024arXiv:2312.14126

active learningopen-set recognitionentropy-based samplingunknown category detection+2

29

citations

#30

CAT-SAM: Conditional Tuning for Few-Shot Adaptation of Segment Anything Model

Aoran Xiao, Weihao Xuan, Heli Qi et al.

VideoWorld: Exploring Knowledge Learning from Unlabeled Videos

Zhongwei Ren, Yunchao Wei, Xun Guo et al.

LAMM: Label Alignment for Multi-Modal Prompt Learning

Jingsheng Gao, Jiacheng Ruan, Suncheng Xiang et al.

AAAI 2024arXiv:2312.08212

prompt tuningvisual-language modelslabel alignmentfew-shot learning+3

28

citations

#33

eTag: Class-Incremental Learning via Embedding Distillation and Task-Oriented Generation

Libo Huang, Yan Zeng, Chuanguang Yang et al.

Unmasking and Improving Data Credibility: A Study with Datasets for Training Harmless Language Models

Zhaowei Zhu, Jialu Wang, Hao Cheng et al.

Contrastive Learning for DeepFake Classification and Localization via Multi-Label Ranking

Cheng-Yao Hong, Yen-Chi Hsu, Tyng-Luh Liu

AMU-Tuning: Effective Logit Bias for CLIP-based Few-shot Learning

Yuwei Tang, ZhenYi Lin, Qilong Wang et al.

Cascade Prompt Learning for Visual-Language Model Adaptation

Ge Wu, Xin Zhang, Zheng Li et al.

NatureLM-audio: an Audio-Language Foundation Model for Bioacoustics

David Robinson, Marius Miron, Masato Hagiwara et al.

ICLR 2025arXiv:2411.07186

audio-language foundation modelbioacoustics taskszero-shot classificationanimal vocalization detection+3

23

citations

#39

Unknown Prompt the only Lacuna: Unveiling CLIP's Potential for Open Domain Generalization

Mainak Singha, Ankit Jha, Shirsha Bose et al.

Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning

Jinlong Pang, Na Di, Zhaowei Zhu et al.

Bayesian Prompt Flow Learning for Zero-Shot Anomaly Detection

Zhen Qu, Xian Tao, Xinyi Gong et al.

Summarizing Stream Data for Memory-Constrained Online Continual Learning

Jianyang Gu, Kai Wang, Wei Jiang et al.

AAAI 2024arXiv:2305.16645

online continual learningreplay-based methodsmemory buffer optimizationknowledge distillation+3

22

citations

#43

Weakly-Supervised Temporal Action Localization by Inferring Salient Snippet-Feature

Wu Yun, Mengshi Qi, Chuanming Wang et al.

AAAI 2024arXiv:2303.12332

weakly-supervised temporal action localizationsalient snippet-feature inferencepseudo label generationtemporal structure exploitation+3

21

citations

#44

Long-Tailed Anomaly Detection with Learnable Class Names

Chih-Hui Ho, Kuan-Chuan Peng, Nuno Vasconcelos

LogicAD: Explainable Anomaly Detection via VLM-based Text Feature Extraction

Er Jin, Qihui Feng, Yongli Mou et al.

SelEx: Self-Expertise in Fine-Grained Generalized Category Discovery

Sarah Rastegar, Mohammadreza Salehi, Yuki M Asano et al.

ECCV 2024arXiv:2408.14371

generalized category discoveryfine-grained categorizationself-expertise learninghierarchical pseudo-labeling+2

20

citations

#47

Principled Data Selection for Alignment: The Hidden Risks of Difficult Examples

chengqian gao, Haonan Li, Liu Liu et al.

Diffusion Language-Shapelets for Semi-supervised Time-Series Classification

Zhen Liu, Wenbin Pei, Disen Lan et al.

Leveraging Cross-Modal Neighbor Representation for Improved CLIP Classification

Chao Yi, Lu Ren, De-Chuan Zhan et al.

Image Clustering via the Principle of Rate Reduction in the Age of Pretrained Models

Tianzhe Chu, Shengbang Tong, Tianjiao Ding et al.

HR-Pro: Point-Supervised Temporal Action Localization via Hierarchical Reliability Propagation

Huaxin Zhang, Xiang Wang, Xiaohao Xu et al.

AAAI 2024arXiv:2308.12608

temporal action localizationpoint-supervised learninghierarchical reliability propagationsnippet-level discrimination+3

19

citations

#52

Reading Your Heart: Learning ECG Words and Sentences via Pre-training ECG Language Model

Jiarui Jin, Haoyu Wang, Hongyan Li et al.

Crowd-SAM:SAM as a smart annotator for object detection in crowded scenes

Zhi Cai, Yingjie Gao, Yaoyan Zheng et al.

Exploring Diverse Representations for Open Set Recognition

Yu Wang, Junxian Mu, Pengfei Zhu et al.

AAAI 2024arXiv:2401.06521

open set recognitionattention diversity regularizationmulti-expert fusiondiscriminative models+4

18

citations

#55

BirdSet: A Large-Scale Dataset for Audio Classification in Avian Bioacoustics

Lukas Rauch, Raphael Schwinger, Moritz Wirth et al.

ICLR 2025arXiv:2403.10380

audio classificationavian bioacousticsmulti-label classificationcovariate shift+3

18

citations

#56

A Label-free Heterophily-guided Approach for Unsupervised Graph Fraud Detection

Junjun Pan, Yixin Liu, Xin Zheng et al.

CLIBD: Bridging Vision and Genomics for Biodiversity Monitoring at Scale

ZeMing Gong, Austin Wang, Xiaoliang Huo et al.

ICLR 2025arXiv:2405.17537

contrastive learningmultimodal fusionbiodiversity monitoringtaxonomic classification+3

18

citations

#58

MLLM-as-a-Judge for Image Safety without Human Labeling

Zhenting Wang, Shuming Hu, Shiyu Zhao et al.

Grounded Object-Centric Learning

Avinash Kori, Francesco Locatello, Fabio De Sousa Ribeiro et al.

Semi-supervised Active Learning for Video Action Detection

Ayush Singh, Aayush J Rana, Akash Kumar et al.

AAAI 2024arXiv:2312.07169

semi-supervised active learningvideo action detectionspatio-temporal localizationinformative sample selection+3

16

citations

#61

Three Heads Are Better than One: Complementary Experts for Long-Tailed Semi-supervised Learning

Chengcheng Ma, Ismail Elezi, Jiankang Deng et al.

AAAI 2024arXiv:2312.15702

long-tailed learningsemi-supervised learningpseudo-label generationclass distribution mismatch+3

16

citations

#62

BioCLIP 2: Emergent Properties from Scaling Hierarchical Contrastive Learning

Jianyang Gu, Sam Stevens, Elizabeth Campolongo et al.

LeVo: High-Quality Song Generation with Multi-Preference Alignment

Shun Lei, Yaoxun XU, ZhiweiLin et al.

NeurIPS 2025arXiv:2506.07520

lyrics-to-song generationaudio language modelsvocal-instrument harmonyparallel token modeling+4

15

citations

#64

Adaptive teachers for amortized samplers

Minsu Kim, Sanghyeok Choi, Taeyoung Yun et al.

ICLR 2025arXiv:2410.01432

amortized inferencegenerative flow networksdiffusion-based samplingsequential decision-making+4

15

citations

#65

ProTeCt: Prompt Tuning for Taxonomic Open Set Classification

Tz-Ying Wu, Chih-Hui Ho, Nuno Vasconcelos

HiLo: A Learning Framework for Generalized Category Discovery Robust to Domain Shifts

Hongjun Wang, Sagar Vaze, Kai Han

Optimizing Temperature for Language Models with Multi-Sample Inference

Weihua Du, Yiming Yang, Sean Welleck

Regroup Median Loss for Combating Label Noise

Authors: Fengpeng Li, Kemou Li, Jinyu Tian et al.

AAAI 2024arXiv:2312.06273

label noisesmall-loss criterionrobust loss estimationsemi-supervised learning+3

14

citations

#69

The Power of LLM-Generated Synthetic Data for Stance Detection in Online Political Discussions

Stefan Sylvius Wagner, Maike Behrendt, Marc Ziegele et al.

Estimating Noisy Class Posterior with Part-level Labels for Noisy Label Learning

Rui Zhao, Bin Shi, Jianfei Ruan et al.

How Contaminated Is Your Benchmark? Measuring Dataset Leakage in Large Language Models with Kernel Divergence

Hyeong Kyu Choi, Maxim Khanov, Hongxin Wei et al.

Just a Hint: Point-Supervised Camouflaged Object Detection

Huafeng Chen, Dian SHAO, Guangqian Guo et al.

Detecting High-Stakes Interactions with Activation Probes

Alex McKenzie, Urja Pawar, Phil Blandfort et al.

xFinder: Large Language Models as Automated Evaluators for Reliable Evaluation

Qingchen Yu, Zifan Zheng, Shichao Song et al.

UniNet: A Contrastive Learning-guided Unified Framework with Feature Selection for Anomaly Detection

Shun Wei, Jielin Jiang, Xiaolong Xu

Robust Self-Paced Hashing for Cross-Modal Retrieval with Noisy Labels

Ruitao Pu, Yuan Sun, Yang Qin et al.

Distilling Reliable Knowledge for Instance-Dependent Partial Label Learning

Dong-Dong Wu, Deng-Bao Wang, Min-Ling Zhang

Coreset Selection via Reducible Loss in Continual Learning

Ruilin Tong, Yuhang Liu, Javen Qinfeng Shi et al.

ICLR 2025

coreset selectioncontinual learningrehearsal memorybilevel optimization+3

12

citations

#79

Multi-Label Cluster Discrimination for Visual Representation Learning

Xiang An, Kaicheng Yang, Xiangzi Dai et al.

ECCV 2024arXiv:2407.17331

contrastive language image pre-trainingimage-text contrastive learningcluster discriminationmulti-label classification+3

12

citations

#80

Discover and Mitigate Multiple Biased Subgroups in Image Classifiers

Zeliang Zhang, Mingqian Feng, Zhiheng Li et al.

Adaptive Self-training Framework for Fine-grained Scene Graph Generation

Kibum Kim, Kanghoon Yoon, Yeonjun In et al.

VisionArena: 230k Real World User-VLM Conversations with Preference Labels

Christopher Chou, Lisa Dunlap, Wei-Lin Chiang et al.

Double-Layer Hybrid-Label Identification Feature Selection for Multi-View Multi-Label Learning

Pingting Hao, Kunpeng Liu, Wanfu Gao

Active Evaluation Acquisition for Efficient LLM Benchmarking

Yang Li, Jie Ma, Miguel Ballesteros et al.

CamoTeacher: Dual-Rotation Consistency Learning for Semi-Supervised Camouflaged Object Detection

Xunfa Lai, Zhiyu Yang, Jie Hu et al.

Dataset Quantization with Active Learning based Adaptive Sampling

Zhenghao Zhao, Yuzhang Shang, Junyi Wu et al.

Bias-Conflict Sample Synthesis and Adversarial Removal Debias Strategy for Temporal Sentence Grounding in Video

Zhaobo Qi, Yibo Yuan, Xiaowen Ruan et al.

AAAI 2024arXiv:2401.07567

temporal sentence groundingdataset biasadversarial trainingmultimodal alignment+4

11

citations

#88

DenseDPO: Fine-Grained Temporal Preference Optimization for Video Diffusion Models

Ziyi Wu, Anil Kag, Ivan Skorokhodov et al.

Dynamic Sub-graph Distillation for Robust Semi-supervised Continual Learning

Yan Fan, Yu Wang, Pengfei Zhu et al.

AAAI 2024arXiv:2312.16409

semi-supervised continual learningknowledge distillationdynamic graph constructioncatastrophic forgetting+2

11

citations

#90

SegAgent: Exploring Pixel Understanding Capabilities in MLLMs by Imitating Human Annotator Trajectories

Muzhi Zhu, Yuzhuo Tian, Hao Chen et al.

KnowPO: Knowledge-Aware Preference Optimization for Controllable Knowledge Selection in Retrieval-Augmented Language Models

Ruizhe Zhang, Yongxin Xu, Yuzhen Xiao et al.

Optimal Sample Complexity of Contrastive Learning

Noga Alon, Dmitrii Avdiukhin, Dor Elboim et al.

Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation

Zhuohang Dang, Minnan Luo, Chengyou Jia et al.

AAAI 2024arXiv:2312.16478

noisy correspondence learningcross-modal retrievalenergy uncertaintyhard negatives+3

11

citations

#94

CDMAD: Class-Distribution-Mismatch-Aware Debiasing for Class-Imbalanced Semi-Supervised Learning

Hyuck Lee, Heeyoung Kim

SeGA: Preference-Aware Self-Contrastive Learning with Prompts for Anomalous User Detection on Twitter

Ying-Ying Chang, Wei-Yao Wang, Wen-Chih Peng

AAAI 2024arXiv:2312.11553

anomalous user detectionself-contrastive learninglarge language modelsuser preference modeling+3

11

citations

#96

Stable Segment Anything Model

Qi Fan, Xin Tao, Lei Ke et al.

Benign Samples Matter! Fine-tuning On Outlier Benign Samples Severely Breaks Safety

Zihan Guan, Mengxuan Hu, Ronghang Zhu et al.

Learning Deformable Hypothesis Sampling for Accurate PatchMatch Multi-View Stereo

Hongjie Li, Yao Guo, Xianwei Zheng et al.

AAAI 2024arXiv:2312.15970

multi-view stereodepth estimationpatchmatch algorithmdeformable sampling+4

10

citations

#99

InsightEdit: Towards Better Instruction Following for Image Editing

Yingjing Xu, Jie Kong, Jiazhi Wang et al.

Estimating Conditional Mutual Information for Dynamic Feature Selection

Soham Gadgil, Ian Covert, Su-In Lee

ICLR 2024

10

citations

Active Learning

Top Conferences

Related Topics (Learning Paradigms)

Top Papers

Monkey: Image Resolution and Text Label Are Important Things for Large Multi-modal Models

OpenChat: Advancing Open-source Language Models with Mixed-Quality Data

AnomalyCLIP: Object-agnostic Prompt Learning for Zero-shot Anomaly Detection

EfficientSAM: Leveraged Masked Image Pretraining for Efficient Segment Anything

Data Filtering Networks

Demystifying CLIP Data

ToolACE: Winning the Points of LLM Function Calling

Towards Open-ended Visual Quality Comparison

When Attention Sink Emerges in Language Models: An Empirical View

Human Feedback is not Gold Standard

Text Prompt with Normality Guidance for Weakly Supervised Video Anomaly Detection

On the Learnability of Watermarks for Language Models

Attention-Challenging Multiple Instance Learning for Whole Slide Image Classification

Position: The No Free Lunch Theorem, Kolmogorov Complexity, and the Role of Inductive Biases in Machine Learning

LatestEval: Addressing Data Contamination in Language Model Evaluation through Dynamic and Time

In-Context Learning Learns Label Relationships but Is Not Conventional Learning

Magic Tokens: Select Diverse Tokens for Multi-modal Object Re-Identification

Organize the Web: Constructing Domains Enhances Pre-Training Data Curation

Learning How Hard to Think: Input-Adaptive Allocation of LM Computation

Debiasing Multimodal Sarcasm Detection with Contrastive Learning

DLF: Disentangled-Language-Focused Multimodal Sentiment Analysis

Does CLIP’s generalization performance mainly stem from high train-test similarity?

Better Call SAL: Towards Learning to Segment Anything in Lidar

Prompting Language-Informed Distribution for Compositional Zero-Shot Learning

Active Generalized Category Discovery

AA-CLIP: Enhancing Zero-Shot Anomaly Detection via Anomaly-Aware CLIP

Modeling Future Conversation Turns to Teach LLMs to Ask Clarifying Questions

Spot the Fake: Large Multimodal Model-Based Synthetic Image Detection with Artifact Explanation

Entropic Open-Set Active Learning

CAT-SAM: Conditional Tuning for Few-Shot Adaptation of Segment Anything Model

VideoWorld: Exploring Knowledge Learning from Unlabeled Videos

LAMM: Label Alignment for Multi-Modal Prompt Learning

eTag: Class-Incremental Learning via Embedding Distillation and Task-Oriented Generation

Unmasking and Improving Data Credibility: A Study with Datasets for Training Harmless Language Models

Contrastive Learning for DeepFake Classification and Localization via Multi-Label Ranking

AMU-Tuning: Effective Logit Bias for CLIP-based Few-shot Learning

Cascade Prompt Learning for Visual-Language Model Adaptation

NatureLM-audio: an Audio-Language Foundation Model for Bioacoustics

Unknown Prompt the only Lacuna: Unveiling CLIP's Potential for Open Domain Generalization

Token Cleaning: Fine-Grained Data Selection for LLM Supervised Fine-Tuning

Bayesian Prompt Flow Learning for Zero-Shot Anomaly Detection

Summarizing Stream Data for Memory-Constrained Online Continual Learning

Weakly-Supervised Temporal Action Localization by Inferring Salient Snippet-Feature

Long-Tailed Anomaly Detection with Learnable Class Names

LogicAD: Explainable Anomaly Detection via VLM-based Text Feature Extraction

SelEx: Self-Expertise in Fine-Grained Generalized Category Discovery

Principled Data Selection for Alignment: The Hidden Risks of Difficult Examples

Diffusion Language-Shapelets for Semi-supervised Time-Series Classification

Leveraging Cross-Modal Neighbor Representation for Improved CLIP Classification

Image Clustering via the Principle of Rate Reduction in the Age of Pretrained Models

HR-Pro: Point-Supervised Temporal Action Localization via Hierarchical Reliability Propagation

Reading Your Heart: Learning ECG Words and Sentences via Pre-training ECG Language Model

Crowd-SAM:SAM as a smart annotator for object detection in crowded scenes

Exploring Diverse Representations for Open Set Recognition

BirdSet: A Large-Scale Dataset for Audio Classification in Avian Bioacoustics

A Label-free Heterophily-guided Approach for Unsupervised Graph Fraud Detection

CLIBD: Bridging Vision and Genomics for Biodiversity Monitoring at Scale

MLLM-as-a-Judge for Image Safety without Human Labeling

Grounded Object-Centric Learning

Semi-supervised Active Learning for Video Action Detection

Three Heads Are Better than One: Complementary Experts for Long-Tailed Semi-supervised Learning

BioCLIP 2: Emergent Properties from Scaling Hierarchical Contrastive Learning

LeVo: High-Quality Song Generation with Multi-Preference Alignment

Adaptive teachers for amortized samplers

ProTeCt: Prompt Tuning for Taxonomic Open Set Classification

HiLo: A Learning Framework for Generalized Category Discovery Robust to Domain Shifts

Optimizing Temperature for Language Models with Multi-Sample Inference

Regroup Median Loss for Combating Label Noise

The Power of LLM-Generated Synthetic Data for Stance Detection in Online Political Discussions

Estimating Noisy Class Posterior with Part-level Labels for Noisy Label Learning

How Contaminated Is Your Benchmark? Measuring Dataset Leakage in Large Language Models with Kernel Divergence

Just a Hint: Point-Supervised Camouflaged Object Detection

Detecting High-Stakes Interactions with Activation Probes

xFinder: Large Language Models as Automated Evaluators for Reliable Evaluation

UniNet: A Contrastive Learning-guided Unified Framework with Feature Selection for Anomaly Detection

Robust Self-Paced Hashing for Cross-Modal Retrieval with Noisy Labels