🧬Vision Recognition

Semantic Segmentation

Pixel-wise classification of images

100 papers2,541 total citations

Compare with other topics

Feb '24 — Jan '26437 papers

Top Conferences

CVPR: 46 ECCV: 22 AAAI: 16 ICLR: 10 ICCV: 4 ICML: 2

Top Papers

#1

EfficientSAM: Leveraged Masked Image Pretraining for Efficient Segment Anything

Yunyang Xiong, Balakrishnan Varadarajan, Lemeng Wu et al.

SCTNet: Single Branch CNN with Transformer Semantic Information for Real-Time Segmentation

Authors: Zhengze Xu, Dongyue Wu, Changqian Yu et al.

AAAI 2024arXiv:2312.17071

real-time segmentationsemantic segmentationsingle branch cnntransformer semantic information+3

126

citations

#3

SCLIP: Rethinking Self-Attention for Dense Vision-Language Inference

Feng Wang, Jieru Mei, Alan Yuille

Stronger Fewer & Superior: Harnessing Vision Foundation Models for Domain Generalized Semantic Segmentation

ZHIXIANG WEI, Lin Chen, Xiaoxiao Ma et al.

SED: A Simple Encoder-Decoder for Open-Vocabulary Semantic Segmentation

Bin Xie, Jiale Cao, Jin Xie et al.

Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation

Sihan liu, Yiwei Ma, Xiaoqing Zhang et al.

GROUNDHOG: Grounding Large Language Models to Holistic Segmentation

Yichi Zhang, Ziqiao Ma, Xiaofeng Gao et al.

ClearCLIP: Decomposing CLIP Representations for Dense Vision-Language Inference

Mengcheng Lan, Chaofeng Chen, Yiping Ke et al.

OmniSeg3D: Omniversal 3D Segmentation via Hierarchical Contrastive Learning

Haiyang Ying, Yixuan Yin, Jinzhi Zhang et al.

Decoupling Static and Hierarchical Motion Perception for Referring Video Segmentation

Shuting He, Henghui Ding

Towards Semantic Equivalence of Tokenization in Multimodal LLM

Shengqiong Wu, Hao Fei, Xiangtai Li et al.

MuSc: Zero-Shot Industrial Anomaly Classification and Segmentation with Mutual Scoring of the Unlabeled Images

Xurui Li, Ziming Huang, Feng Xue et al.

A Decade's Battle on Dataset Bias: Are We There Yet?

Zhuang Liu, Kaiming He

FlashSplat: 2D to 3D Gaussian Splatting Segmentation Solved Optimally

Qiuhong Shen, Xingyi Yang, Xinchao Wang

Better Call SAL: Towards Learning to Segment Anything in Lidar

Aljoša Ošep, Tim Meinhardt, Francesco Ferroni et al.

Distilling Semantic Priors from SAM to Efficient Image Restoration Models

Quan Zhang, Xiaoyu Liu, Wei Li et al.

RobustSAM: Segment Anything Robustly on Degraded Images

Wei-Ting Chen, Yu Jiet Vong, Sy-Yen Kuo et al.

Generalizable Whole Slide Image Classification with Fine-Grained Visual-Semantic Interaction

Hao Li, Ying Chen, Yifei Chen et al.

CFR-ICL: Cascade-Forward Refinement with Iterative Click Loss for Interactive Image Segmentation

Shoukun Sun, Min Xian, Fei Xu et al.

AAAI 2024arXiv:2303.05620

interactive image segmentationclick-based segmentationcascade-forward refinementiterative click loss+4

32

citations

#20

Text4Seg: Reimagining Image Segmentation as Text Generation

Mengcheng Lan, Chaofeng Chen, Yue Zhou et al.

Skeleton Recall Loss for Connectivity Conserving and Resource Efficient Segmentation of Thin Tubular Structures

Yannick Kirchhoff, Maximilian Rokuss, Saikat Roy et al.

EAGLE: Eigen Aggregation Learning for Object-Centric Unsupervised Semantic Segmentation

Chanyoung Kim, Woojung Han, Dayun Ju et al.

Style Blind Domain Generalized Semantic Segmentation via Covariance Alignment and Semantic Consistence Contrastive Learning

Woo-Jin Ahn, Geun-Yeong Yang, Hyunduck Choi et al.

Relevant Intrinsic Feature Enhancement Network for Few-Shot Semantic Segmentation

Xiaoyi Bao, Jie Qin, Siyang Sun et al.

AAAI 2024arXiv:2312.06474

few-shot semantic segmentationintrinsic feature enhancementmulti-level prototype generationsemantic ambiguity+4

30

citations

#25

Hunting Attributes: Context Prototype-Aware Learning for Weakly Supervised Semantic Segmentation

feilong tang, Zhongxing Xu, Zhaojun QU et al.

Frozen CLIP: A Strong Backbone for Weakly Supervised Semantic Segmentation

Bingfeng Zhang, Siyue Yu, Yunchao Wei et al.

RUN: Reversible Unfolding Network for Concealed Object Segmentation

Chunming He, Rihan Zhang, Fengyang Xiao et al.

Open-Vocabulary Semantic Segmentation with Image Embedding Balancing

Xiangheng Shan, Dongyue Wu, Guilin Zhu et al.

Curriculum Point Prompting for Weakly-Supervised Referring Image Segmentation

Qiyuan Dai, Sibei Yang

Image-to-Image Matching via Foundation Models: A New Perspective for Open-Vocabulary Semantic Segmentation

Yuan Wang, Rui Sun, Naisong Luo et al.

Tyche: Stochastic In-Context Learning for Medical Image Segmentation

Marianne Rakic, Hallee Wong, Jose Javier Gonzalez Ortiz et al.

Interactive Medical Image Segmentation: A Benchmark Dataset and Baseline

Junlong Cheng, Bin Fu, Jin Ye et al.

Reliability in Semantic Segmentation: Can We Use Synthetic Data?

Thibaut Loiseau, Tuan Hung Vu, Mickael Chen et al.

Adaptive FSS: A Novel Few-Shot Segmentation Framework via Prototype Enhancement

Jing Wang, Jiangyun Li, Chen Chen et al.

AAAI 2024arXiv:2312.15731

few-shot segmentationprototype enhancementadapter mechanismmeta-learning+3

21

citations

#35

Region-Adaptive Transform with Segmentation Prior for Image Compression

Yuxi Liu, Wenhan Yang, Huihui Bai et al.

ECCV 2024arXiv:2403.00628

learned image compressionregion-adaptive transformsegmentation prioradaptive convolutions+3

21

citations

#36

When Semantic Segmentation Meets Frequency Aliasing

Linwei Chen, Lin Gu, Ying Fu

Visual Prompting for Generalized Few-shot Segmentation: A Multi-scale Approach

Mir Rayat Imtiaz Hossain, Mennatullah Siam, Leonid Sigal et al.

Cascade-CLIP: Cascaded Vision-Language Embeddings Alignment for Zero-Shot Semantic Segmentation

Yunheng Li, Zhong-Yu Li, Quan-Sheng Zeng et al.

ICML 2024

vision-language modelszero-shot semantic segmentationmulti-level visual featuresembedding alignment+2

20

citations

#39

Densely Connected Parameter-Efficient Tuning for Referring Image Segmentation

Jiaqi Huang, Zunnan Xu, Ting Liu et al.

The Devil is in Temporal Token: High Quality Video Reasoning Segmentation

Sitong Gong, Yunzhi Zhuge, Lu Zhang et al.

Image-Text Co-Decomposition for Text-Supervised Semantic Segmentation

Ji-Jia Wu, Andy Chia-Hao Chang, Chieh-Yu Chuang et al.

SFPNet: Sparse Focal Point Network for Semantic Segmentation on General LiDAR Point Clouds

Yanbo Wang, Wentao Zhao, Cao Chuan et al.

Weakly Supervised Semantic Segmentation for Driving Scenes

Dongseob Kim, Seungho Lee, Junsuk Choe et al.

AAAI 2024arXiv:2312.13646

weakly supervised semantic segmentationdriving scene datasetscontrastive language-image pre-trainingsmall object detection+4

17

citations

#44

Scalable Image Tokenization with Index Backpropagation Quantization

Fengyuan Shi, Zhuoyan Luo, Yixiao Ge et al.

PartSTAD: 2D-to-3D Part Segmentation Task Adaptation

Hyunjin Kim, Minhyuk Sung

Learning Hierarchical Image Segmentation For Recognition and By Recognition

Tsung-Wei Ke, Sangwoo Mo, Stella Yu

Kandinsky Conformal Prediction: Efficient Calibration of Image Segmentation Algorithms

Joren Brunekreef, Eric Marcus, Ray Sheombarsing et al.

MeshSegmenter: Zero-Shot Mesh Segmentation via Texture Synthesis

ziming zhong, Yanyu Xu, Jing Li et al.

Versatile Medical Image Segmentation Learned from Multi-Source Datasets via Model Self-Disambiguation

Xiaoyang Chen, Hao Zheng, Yuemeng LI et al.

OTSeg: Multi-prompt Sinkhorn Attention for Zero-Shot Semantic Segmentation

Kwanyoung Kim, Yujin Oh, Jong Chul Ye

MCPNet: An Interpretable Classifier via Multi-Level Concept Prototypes

Bor Shiun Wang, Chien-Yi Wang, Wei-Chen Chiu

Spike2Former: Efficient Spiking Transformer for High-performance Image Segmentation

Zhenxin Lei, Man Yao, Jiakui Hu et al.

PH-Net: Semi-Supervised Breast Lesion Segmentation via Patch-wise Hardness

Siyao Jiang, Huisi Wu, Junyang Chen et al.

USE: Universal Segment Embeddings for Open-Vocabulary Image Segmentation

Xiaoqi Wang, Wenbin He, Xiwei Xuan et al.

Scribble Hides Class: Promoting Scribble-Based Weakly-Supervised Semantic Segmentation

Xinliang Zhang, Lei Zhu, Hangzhou He et al.

AAAI 2024arXiv:2402.17555

weakly-supervised semantic segmentationscribble annotationpseudo-label generationlocalization rectification module+3

13

citations

#56

Pseudo-RIS: Distinctive Pseudo-supervision Generation for Referring Image Segmentation

Seonghoon Yu, Paul Hongsuck Seo, Jeany Son

Discover and Mitigate Multiple Biased Subgroups in Image Classifiers

Zeliang Zhang, Mingqian Feng, Zhiheng Li et al.

Early Preparation Pays Off: New Classifier Pre-tuning for Class Incremental Semantic Segmentation

Zhengyuan Xie, Haiquan Lu, Jia-wen Xiao et al.

InstructSeg: Unifying Instructed Visual Segmentation with Multi-modal Large Language Models

Cong Wei, Yujie Zhong, yingsen zeng et al.

SRFormer: Text Detection Transformer with Incorporated Segmentation and Regression

Qingwen Bu, Sungrae Park, Minsoo Khang et al.

AAAI 2024arXiv:2308.10531

text detectionsegmentation-based methodsregression-based methodsdetr-based model+3

12

citations

#61

Prototype-Based Image Prompting for Weakly Supervised Histopathological Image Segmentation

Qingchen Tang, Lei Fan, Maurice Pagnucco et al.

Improving Bird's Eye View Semantic Segmentation by Task Decomposition

Tianhao Zhao, Yongcan Chen, Yu Wu et al.

Audio-Visual Instance Segmentation

Ruohao Guo, Xianghua Ying, Yaru Chen et al.

BLADE: Box-Level Supervised Amodal Segmentation through Directed Expansion

Zhaochen Liu, Zhixuan Li, Tingting Jiang

AAAI 2024arXiv:2401.01642

amodal segmentationbox-level supervisiondirected expansionoccluded objects+3

11

citations

#65

Flattening the Parent Bias: Hierarchical Semantic Segmentation in the Poincaré Ball

Simon Weber, Barış Zöngür, Nikita Araslanov et al.

Semantic and Sequential Alignment for Referring Video Object Segmentation

Feiyu Pan, Hao Fang, Fangkai Li et al.

Stable Segment Anything Model

Qi Fan, Xin Tao, Lei Ke et al.

Harnessing Vision Foundation Models for High-Performance, Training-Free Open Vocabulary Segmentation

Yuheng Shi, Minjing Dong, Chang Xu

PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation

Ning Gao, Sanping Zhou, Le Wang et al.

ContextSeg: Sketch Semantic Segmentation by Querying the Context with Attention

Jiawei Wang, Changjian Li

HiMTok: Learning Hierarchical Mask Tokens for Image Segmentation with Large Multimodal Model

Tao Wang, Changxu Cheng, Lingfeng Wang et al.

RMP-SAM: Towards Real-Time Multi-Purpose Segment Anything

Shilin Xu, Haobo Yuan, Qingyu Shi et al.

ZoRI: Towards Discriminative Zero-Shot Remote Sensing Instance Segmentation

Shiqi Huang, Shuting He, Bihan Wen

DIAL: Dense Image-text ALignment for Weakly Supervised Semantic Segmentation

Soojin Jang, JungMin Yun, JuneHyoung Kwon et al.

Unsupervised Audio-Visual Segmentation with Modality Alignment

Swapnil Bhosale, Haosen Yang, Diptesh Kanojia et al.

Topograph: An Efficient Graph-Based Framework for Strictly Topology Preserving Image Segmentation

Laurin Lux, Alexander H Berger, Alexander Weers et al.

SemReg: Semantics Constrained Point Cloud Registration

Sheldon Fung, Xuequan Lu, Dasith de Silva Edirimuni et al.

ECCV 2024

point cloud registrationcross-modal frameworksemantic feature fusioncross-attention mechanism+3

7

citations

#78

Instruction-guided Multi-Granularity Segmentation and Captioning with Large Multimodal Model

Xu Yuan, Li Zhou, Zenghui Sun et al.

M3amba: Memory Mamba is All You Need for Whole Slide Image Classification

Tingting Zheng, Kui Jiang, Yi Xiao et al.

Background Adaptation with Residual Modeling for Exemplar-Free Class-Incremental Semantic Segmentation

Anqi Zhang, Guangyu Gao

FOCUS: Knowledge-enhanced Adaptive Visual Compression for Few-shot Whole Slide Image Classification

Zhengrui Guo, Conghao Xiong, Jiabo MA et al.

Knowledge-Enhanced Historical Document Segmentation and Recognition

En-Hao Gao, Yu-Xuan Huang, Wen-Chao Hu et al.

Extreme Point Supervised Instance Segmentation

Hyeonjun Lee, Sehyun Hwang, Suha Kwak

SMITE: Segment Me In TimE

Amirhossein Alimohammadi, Sauradip Nag, Saeid Asgari et al.

ML-SemReg: Boosting Point Cloud Registration with Multi-level Semantic Consistency

Shaocheng Yan, Pengcheng Shi, Jiayuan Li

Inversion Circle Interpolation: Diffusion-based Image Augmentation for Data-scarce Classification

Yanghao Wang, Long Chen

Semantic Library Adaptation: LoRA Retrieval and Fusion for Open-Vocabulary Semantic Segmentation

Reza Qorbani, Gianluca Villani, Theodoros Panagiotakopoulos et al.

Enhancing SAM with Efficient Prompting and Preference Optimization for Semi-supervised Medical Image Segmentation

Aishik Konwer, Zhijian Yang, Erhan Bas et al.

DyCON: Dynamic Uncertainty-aware Consistency and Contrastive Learning for Semi-supervised Medical Image Segmentation

Maregu Assefa, Muzammal Naseer, IYYAKUTTI IYAPPAN GANAPATHI et al.

CVPR 2025arXiv:2504.04566

semi-supervised learningmedical image segmentationconsistency learningcontrastive learning+4

6

citations

#90

SPIN: Hierarchical Segmentation with Subpart Granularity in Natural Images

josh myers-dean, Jarek T Reynolds, Brian Price et al.

ProtoArgNet: Interpretable Image Classification with Super-Prototypes and Argumentation

Hamed Ayoobi, Nico Potyka, Francesca Toni

EOV-Seg: Efficient Open-Vocabulary Panoptic Segmentation

Hongwei Niu, Jie Hu, Jianghang Lin et al.

Exploring Simple Open-Vocabulary Semantic Segmentation

Zihang Lai

Weakly Supervised Co-training with Swapping Assignments for Semantic Segmentation

Xinyu Yang, Hossein Rahmani, Sue Black et al.

ECCV 2024arXiv:2402.17891

weakly supervised semantic segmentationclass activation mapspseudo-label generationonline cam optimization+3

5

citations

#95

Exact: Exploring Space-Time Perceptive Clues for Weakly Supervised Satellite Image Time Series Semantic Segmentation

Hao Zhu, Yan Zhu, Jiayu Xiao et al.

POT: Prototypical Optimal Transport for Weakly Supervised Semantic Segmentation

Jian Wang, Tianhong Dai, Bingfeng Zhang et al.

AlignZeg: Mitigating Objective Misalignment for Zero-shot Semantic Segmentation

Jiannan Ge, Lingxi Xie, Hongtao Xie et al.

Learning from the Web: Language Drives Weakly-Supervised Incremental Learning for Semantic Segmentation

Chang Liu, Giulia Rizzoli, Pietro Zanuttigh et al.

ECCV 2024arXiv:2407.13363

semantic segmentationweakly-supervised learningincremental learningweb image mining+3

5

citations

#99

Seg2Reg: Differentiable 2D Segmentation to 1D Regression Rendering for 360 Room Layout Reconstruction

Cheng Sun, Wei-En Tai, Yu-Lin Shih et al.

Interpretable Image Classification via Non-parametric Part Prototype Learning

Zhijie Zhu, Lei Fan, Maurice Pagnucco et al.

CVPR 2025

5

citations

Semantic Segmentation

Top Conferences

Related Topics (Vision Recognition)

Top Papers

EfficientSAM: Leveraged Masked Image Pretraining for Efficient Segment Anything

SCTNet: Single Branch CNN with Transformer Semantic Information for Real-Time Segmentation

SCLIP: Rethinking Self-Attention for Dense Vision-Language Inference

Stronger Fewer & Superior: Harnessing Vision Foundation Models for Domain Generalized Semantic Segmentation

SED: A Simple Encoder-Decoder for Open-Vocabulary Semantic Segmentation

Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation

GROUNDHOG: Grounding Large Language Models to Holistic Segmentation

ClearCLIP: Decomposing CLIP Representations for Dense Vision-Language Inference

OmniSeg3D: Omniversal 3D Segmentation via Hierarchical Contrastive Learning

Decoupling Static and Hierarchical Motion Perception for Referring Video Segmentation

Towards Semantic Equivalence of Tokenization in Multimodal LLM

MuSc: Zero-Shot Industrial Anomaly Classification and Segmentation with Mutual Scoring of the Unlabeled Images

A Decade's Battle on Dataset Bias: Are We There Yet?

FlashSplat: 2D to 3D Gaussian Splatting Segmentation Solved Optimally

Better Call SAL: Towards Learning to Segment Anything in Lidar

Distilling Semantic Priors from SAM to Efficient Image Restoration Models

RobustSAM: Segment Anything Robustly on Degraded Images

Generalizable Whole Slide Image Classification with Fine-Grained Visual-Semantic Interaction

CFR-ICL: Cascade-Forward Refinement with Iterative Click Loss for Interactive Image Segmentation

Text4Seg: Reimagining Image Segmentation as Text Generation

Skeleton Recall Loss for Connectivity Conserving and Resource Efficient Segmentation of Thin Tubular Structures

EAGLE: Eigen Aggregation Learning for Object-Centric Unsupervised Semantic Segmentation

Style Blind Domain Generalized Semantic Segmentation via Covariance Alignment and Semantic Consistence Contrastive Learning

Relevant Intrinsic Feature Enhancement Network for Few-Shot Semantic Segmentation

Hunting Attributes: Context Prototype-Aware Learning for Weakly Supervised Semantic Segmentation

Frozen CLIP: A Strong Backbone for Weakly Supervised Semantic Segmentation

RUN: Reversible Unfolding Network for Concealed Object Segmentation

Open-Vocabulary Semantic Segmentation with Image Embedding Balancing

Curriculum Point Prompting for Weakly-Supervised Referring Image Segmentation

Image-to-Image Matching via Foundation Models: A New Perspective for Open-Vocabulary Semantic Segmentation

Tyche: Stochastic In-Context Learning for Medical Image Segmentation

Interactive Medical Image Segmentation: A Benchmark Dataset and Baseline

Reliability in Semantic Segmentation: Can We Use Synthetic Data?

Adaptive FSS: A Novel Few-Shot Segmentation Framework via Prototype Enhancement

Region-Adaptive Transform with Segmentation Prior for Image Compression

When Semantic Segmentation Meets Frequency Aliasing

Visual Prompting for Generalized Few-shot Segmentation: A Multi-scale Approach

Cascade-CLIP: Cascaded Vision-Language Embeddings Alignment for Zero-Shot Semantic Segmentation

Densely Connected Parameter-Efficient Tuning for Referring Image Segmentation

The Devil is in Temporal Token: High Quality Video Reasoning Segmentation

Image-Text Co-Decomposition for Text-Supervised Semantic Segmentation

SFPNet: Sparse Focal Point Network for Semantic Segmentation on General LiDAR Point Clouds

Weakly Supervised Semantic Segmentation for Driving Scenes

Scalable Image Tokenization with Index Backpropagation Quantization

PartSTAD: 2D-to-3D Part Segmentation Task Adaptation

Learning Hierarchical Image Segmentation For Recognition and By Recognition

Kandinsky Conformal Prediction: Efficient Calibration of Image Segmentation Algorithms

MeshSegmenter: Zero-Shot Mesh Segmentation via Texture Synthesis

Versatile Medical Image Segmentation Learned from Multi-Source Datasets via Model Self-Disambiguation

OTSeg: Multi-prompt Sinkhorn Attention for Zero-Shot Semantic Segmentation

MCPNet: An Interpretable Classifier via Multi-Level Concept Prototypes

Spike2Former: Efficient Spiking Transformer for High-performance Image Segmentation

PH-Net: Semi-Supervised Breast Lesion Segmentation via Patch-wise Hardness

USE: Universal Segment Embeddings for Open-Vocabulary Image Segmentation

Scribble Hides Class: Promoting Scribble-Based Weakly-Supervised Semantic Segmentation

Pseudo-RIS: Distinctive Pseudo-supervision Generation for Referring Image Segmentation

Discover and Mitigate Multiple Biased Subgroups in Image Classifiers

Early Preparation Pays Off: New Classifier Pre-tuning for Class Incremental Semantic Segmentation

InstructSeg: Unifying Instructed Visual Segmentation with Multi-modal Large Language Models

SRFormer: Text Detection Transformer with Incorporated Segmentation and Regression

Prototype-Based Image Prompting for Weakly Supervised Histopathological Image Segmentation

Improving Bird's Eye View Semantic Segmentation by Task Decomposition

Audio-Visual Instance Segmentation

BLADE: Box-Level Supervised Amodal Segmentation through Directed Expansion

Flattening the Parent Bias: Hierarchical Semantic Segmentation in the Poincaré Ball

Semantic and Sequential Alignment for Referring Video Object Segmentation

Stable Segment Anything Model

Harnessing Vision Foundation Models for High-Performance, Training-Free Open Vocabulary Segmentation

PMT: Progressive Mean Teacher via Exploring Temporal Consistency for Semi-Supervised Medical Image Segmentation

ContextSeg: Sketch Semantic Segmentation by Querying the Context with Attention

HiMTok: Learning Hierarchical Mask Tokens for Image Segmentation with Large Multimodal Model

RMP-SAM: Towards Real-Time Multi-Purpose Segment Anything

ZoRI: Towards Discriminative Zero-Shot Remote Sensing Instance Segmentation

DIAL: Dense Image-text ALignment for Weakly Supervised Semantic Segmentation

Unsupervised Audio-Visual Segmentation with Modality Alignment

Topograph: An Efficient Graph-Based Framework for Strictly Topology Preserving Image Segmentation