State Space Models

NeurIPS 2025arXiv:2503.13657

#3

Why Do Multi-Agent LLM Systems Fail?

Mert Cemri, Melissa Z Pan, Shuyi Yang et al.

multi-agent llm systemsfailure pattern analysissystem failure taxonomyllm-as-a-judge+3

188

CVPR 2025arXiv:2405.07992

#4

ZigMa: A DiT-style Zigzag Mamba Diffusion Model

Tao Hu, Stefan Andreas Baumann, Ming Gui et al.

MambaOut: Do We Really Need Mamba for Vision?

Weihao Yu, Xinchao Wang

state space modelattention mechanismimage classificationobject detection+4

186

ECCV 2024arXiv:2402.03246

#6

SGS-SLAM: Semantic Gaussian Splatting For Neural Dense SLAM

Mingrui Li, Shuhong Liu, Heng Zhou et al.

gaussian splattingvisual slamsemantic segmentationneural implicit slam+4

131

ECCV 2024arXiv:2407.07520

#7

Samba: Simple Hybrid State Space Models for Efficient Unlimited Context Language Modeling

Liliang Ren, Yang Liu, Yadong Lu et al.

IRSAM: Advancing Segment Anything Model for Infrared Small Target Detection

Mingjin Zhang, Yuchun Wang, Jie Guo et al.

infrared small target detectionsegment anything modelthermal image segmentationperona-malik diffusion+4

110

ECCV 2024arXiv:2403.07487

#9

Motion Mamba: Efficient and Long Sequence Motion Generation

Zeyu Zhang, Akide Liu, Ian Reid et al.

state space modelsmotion generationlong sequence modelinghuman motion generation+4

108

CVPR 2025arXiv:2411.15269

#10

ManiGaussian: Dynamic Gaussian Splatting for Multi-task Robotic Manipulation

Guanxing Lu, Shiyi Zhang, Ziwei Wang et al.

Agent S: An Open Agentic Framework that Uses Computers Like a Human

Saaket Agashe, Jiuzhou Han, Shuyu Gan et al.

MambaIRv2: Attentive State Space Restoration

Hang Guo, Yong Guo, Yaohua Zha et al.

image restorationstate space modelsnon-causal modelingattention mechanism+4

82

NeurIPS 2025arXiv:2506.23971

#13

Point Cloud Mamba: Point Cloud Learning via State Space Model

Tao Zhang, Haobo Yuan, Lu Qi et al.

UMA: A Family of Universal Models for Atoms

Brandon Wood, Misko Dzamba, Xiang Fu et al.

atomic simulationsmaterials sciencemixture of linear expertsempirical scaling laws+4

62

ICLR 2025arXiv:2411.13676

#15

Hymba: A Hybrid-head Architecture for Small Language Models

Xin Dong, Yonggan Fu, Shizhe Diao et al.

small language modelshybrid-head architecturetransformer attention mechanismsstate space models+3

55

ECCV 2024arXiv:2403.19435

#16

SubT-MRS Dataset: Pushing SLAM Towards All-weather Environments

Shibo Zhao, Yuanjun Gao, Tianhao Wu et al.

ReMamber: Referring Image Segmentation with Mamba Twister

Yuhuan Yang, Chaofan Ma, Jiangchao Yao et al.

OMG: Towards Open-vocabulary Motion Generation via Mixture of Controllers

Han Liang, Jiacheng Bao, Ruichi Zhang et al.

BAMM: Bidirectional Autoregressive Motion Model

Ekkasit Pinyoanuntapong, Muhammad Usama Saleem, Pu Wang et al.

text-to-motion generationautoregressive motion modelsmotion tokenizermasked self-attention transformer+4

42

NeurIPS 2025arXiv:2505.24857

#20

Accelerated Sampling from Masked Diffusion Models via Entropy Bounded Unmasking

Heli Ben-Hamu, Itai Gat, Daniel Severo et al.

masked diffusion modelsaccelerated samplingentropy bounded unmaskinglanguage modeling+3

40

AAAI 2024arXiv:2401.06385

#21

TinySAM: Pushing the Envelope for Efficient Segment Anything Model

Han Shu, Wenshuo Li, Yehui Tang et al.

STI-Bench: Are MLLMs Ready for Precise Spatial-Temporal World Understanding?

Yun Li, Yiming Zhang, Tao Lin et al.

SD-MVS: Segmentation-Driven Deformation Multi-View Stereo with Spherical Refinement and EM Optimization

Zhenlong Yuan, Jiakai Cao, Zhaoxin Li et al.

multi-view stereo3d reconstructiontextureless areassegment anything model+4

35

NeurIPS 2025arXiv:2503.08153

#24

WISA: World simulator assistant for physics-aware text-to-video generation

Jing Wang, Ao Ma, Ke Cao et al.

text-to-video generationphysics-aware generationworld simulatorsphysical principles decomposition+3

34

robotic manipulationvision-language-action modeldual-system architectureparameter sharing+4

#25

Scaling Wearable Foundation Models

Girish Narayanswamy, Xin Liu, Kumar Ayush et al.

System 1.x: Learning to Balance Fast and Slow Planning with Language Models

Swarnadeep Saha, Archiki Prasad, Justin Chen et al.

Longhorn: State Space Models are Amortized Online Learners

Bo Liu, Rui Wang, Lemeng Wu et al.

WildGS-SLAM: Monocular Gaussian Splatting SLAM in Dynamic Environments

Jianhao Zheng, Zihan Zhu, Valentin Bieri et al.

Fast-in-Slow: A Dual-System VLA Model Unifying Fast Manipulation within Slow Reasoning

Hao Chen, Jiaming Liu, Chenyang Gu et al.

NeurIPS 2025

27

ICCV 2025arXiv:2411.17762

#30

EfficientViM: Efficient Vision Mamba with Hidden State Mixer based State Space Duality

Sanghyeok Lee, Joonmyung Choi, Hyunwoo J. Kim

MUSE-VL: Modeling Unified VLM through Semantic Discrete Encoding

Rongchang Xie, Chen Du, Ping Song et al.

vision-language modelssemantic discrete encodingmultimodal understandingvisual generation+3

25

ICCV 2025arXiv:2407.18559

#32

MTMamba: Enhancing Multi-Task Dense Scene Understanding by Mamba-Based Decoders

Baijiong Lin, Weisen Jiang, Pengguang Chen et al.

VSSD: Vision Mamba with Non-Causal State Space Duality

Yuheng Shi, Mingjia Li, Minjing Dong et al.

state space modelsvision transformersnon-causal modelingimage classification+4

24

ICLR 2025arXiv:2410.03943

#34

AlignSAM: Aligning Segment Anything Model to Open Context via Reinforcement Learning

Duojun Huang, Xinyu Xiong, Jie Ma et al.

VideoMamba: Spatio-Temporal Selective State Space Model

Jinyoung Park, Hee-Seon Kim, Kangwook Ko et al.

Semantics-Adaptive Activation Intervention for LLMs via Dynamic Steering Vectors

Weixuan Wang, JINGYUAN YANG, Wei Peng

G-Memory: Tracing Hierarchical Memory for Multi-Agent Systems

Guibin Zhang, Muxin Fu, Kun Wang et al.

Robust Tracking via Mamba-based Context-aware Token Learning

Jinxia Xie, Bineng Zhong, Qihua Liang et al.

Oscillatory State-Space Models

T. Konstantin Rusch, Daniela Rus

state-space modelsharmonic oscillatorslong sequencestime-series forecasting+4

21

CVPR 2025arXiv:2412.00678

#40

2DMamba: Efficient State Space Model for Image Representation with Applications on Giga-Pixel Whole Slide Image Classification

Jingwei Zhang, Anh Tien Nguyen, Xi Han et al.

state space modelsimage representationwhole slide imagingcomputational efficiency+4

20

NeurIPS 2025arXiv:2502.01506

#41

OccMamba: Semantic Occupancy Prediction with State Space Models

Heng Li, Yuenan Hou, Xiaohan Xing et al.

QMambaBSR: Burst Image Super-Resolution with Query State Space Model

Xin Di, Long Peng, Peizhe Xia et al.

TwinMarket: A Scalable Behavioral and Social Simulation for Financial Markets

Yuzhe YANG, Yifei Zhang, Minghao Wu et al.

multi-agent simulationbehavioral economicslarge language model agentssocial emergence+4

19

AAAI 2024arXiv:2401.02614

#44

SpikingSSMs: Learning Long Sequences with Sparse and Parallel Spiking State Space Models

Shuaijie Shen, Chao Wang, Renzhuo Huang et al.

Scaling and Masking: A New Paradigm of Data Sampling for Image and Video Quality Assessment

Yongxu Liu, Yinghui Quan, Guoyao Xiao et al.

image quality assessmentvideo quality assessmentdata sampling methodsmulti-scale representation+4

17

ICLR 2025arXiv:2405.16674

#46

Towards Universality: Studying Mechanistic Similarity Across Language Model Architectures

Junxuan Wang, Xuyang Ge, Wentao Shu et al.

Limits of Deep Learning: Sequence Modeling through the Lens of Complexity Theory

Nikola Zubic, Federico Soldà, Aurelio Sulser et al.

sequence modelingstructured state space modelsfunction compositioncomputational complexity theory+4

17

CVPR 2025arXiv:2412.00833

#48

AlignMamba: Enhancing Multimodal Mamba with Local and Global Cross-modal Alignment

Yan Li, Yifei Xing, Xiangyuan Lan et al.

multimodal fusioncross-modal alignmentmamba modelsoptimal transport+3

17

CVPR 2025arXiv:2503.03437

#49

Model Swarms: Collaborative Search to Adapt LLM Experts via Swarm Intelligence

Shangbin Feng, Zifeng Wang, Yike Wang et al.

Quamba: A Post-Training Quantization Recipe for Selective State Space Models

Hung-Yueh Chiang, Chi-Chih Chang, Natalia Frumkin et al.

MambaIC: State Space Models for High-Performance Learned Image Compression

Fanhu Zeng, Hao Tang, Yihua Shao et al.

JamMa: Ultra-lightweight Local Feature Matching with Joint Mamba

Xiaoyong Lu, Songlin Du

local feature matchingmamba architecturelinear complexityscan-merge strategy+3

14

ICLR 2025arXiv:2311.15776

#53

Event-based Video Super-Resolution via State Space Models

Zeyu Xiao, Xinchao Wang

Stable Segment Anything Model

Qi Fan, Xin Tao, Lei Ke et al.

promptable segmentationsegmentation stabilitydeformable samplingmask attention calibration+3

12

ICLR 2025arXiv:2405.16305

#55

Symphony: Symmetry-Equivariant Point-Centered Spherical Harmonics for 3D Molecule Generation

Ameya Daigavane, Song Eun Kim, Mario Geiger et al.

DG-Mamba: Robust and Efficient Dynamic Graph Structure Learning with Selective State Space Models

Haonan Yuan, Qingyun Sun, Zhaonan Wang et al.

Efficiently Parameterized Neural Metriplectic Systems

Anthony Gruber, Kookjin Lee, Haksoo Lim et al.

metriplectic systemsenergy conserving systemsentropy stabilitydynamics learning+2

NeurIPS 2025arXiv:2503.10392

#58

RoMA: Scaling up Mamba-based Foundation Models for Remote Sensing

Fengxiang Wang, Yulin Wang, Mingshuo Chen et al.

remote sensing foundation modelsmamba architectureself-supervised learninglinear-complexity models+4

ICLR 2025arXiv:2405.15376

#59

Fast training and sampling of Restricted Boltzmann Machines

Nicolas BEREUX, Aurélien Decelle, Cyril Furtlehner et al.

restricted boltzmann machinesmarkov chain monte carloparallel trajectory temperingpartition function computation+4

ICLR 2025arXiv:2405.17680

#60

Sports-Traj: A Unified Trajectory Generation Model for Multi-Agent Movement in Sports

Yi Xu, Yun Fu

trajectory generationmulti-agent movementtrajectory predictionspatial-temporal recovery+4

ECCV 2024arXiv:2407.11494

#61

Learning Semantic Latent Directions for Accurate and Controllable Human Motion Prediction

Guowei Xu, Jiale Tao, Wen Li et al.

human motion predictionsemantic latent directionsgenerative modelslatent space control+3

9

CVPR 2025arXiv:2503.10898

#62

Motion Diversification Networks

Hee Jae Kim, Eshed Ohn-Bar

SOLAMI: Social Vision-Language-Action Modeling for Immersive Interaction with 3D Autonomous Characters

Jianping Jiang, Weiye Xiao, Zhengyu Lin et al.

Trajectory Mamba: Efficient Attention-Mamba Forecasting Model Based on Selective SSM

Yizhou Huang, Yihua Cheng, Kezhi Wang

trajectory predictionselective state-space modelautonomous drivingmotion forecasting+4

9

protein language modelsstructure token generationmutation stability assessmentprotein structure prediction+4

#65

Hyperion – A fast, versatile symbolic Gaussian Belief Propagation framework for Continuous-Time SLAM

David Hug, Ignacio Alzugaray Lopez, Margarita Chli

Distilling Structural Representations into Protein Sequence Models

Jeffrey Ouyang-Zhang, Chengyue Gong, Yue Zhao et al.

ICLR 2025

8

ICCV 2025arXiv:2505.05307

#67

PRE-Mamba: A 4D State Space Model for Ultra-High-Frequent Event Camera Deraining

Ciyu Ruan, Ruishan Guo, Zihang GONG et al.

event camera deraining4d state space modelspatiotemporal event representationpoint-based event processing+3

8

ICLR 2025arXiv:2503.00900

#68

Compositional simulation-based inference for time series

Manuel Gloeckler, Shoji Toyota, Kenji Fukumizu et al.

Sparse Learning for State Space Models on Mobile

Xuan Shen, Hangyu Zheng, Yifan Gong et al.

LOMA: Language-assisted Semantic Occupancy Network via Triplane Mamba

Yubo Cui, Zhiheng Li, Jiaqiang Wang et al.

ModeSeq: Taming Sparse Multimodal Motion Prediction with Sequential Mode Modeling

Zikang Zhou, Hengjian Zhou, Haibo Hu et al.

SemGeoMo: Dynamic Contextual Human Motion Generation with Semantic and Geometric Guidance

Peishan Cong, Ziyi Wang, Yuexin Ma et al.

M3amba: Memory Mamba is All You Need for Whole Slide Image Classification

Tingting Zheng, Kui Jiang, Yi Xiao et al.

Understanding and Mitigating Bottlenecks of State Space Models through the Lens of Recency and Over-smoothing

Peihao Wang, Ruisi Cai, Yuehao Wang et al.

S4M: S4 for multivariate time series forecasting with Missing values

Jing Peng, Meiqi Yang, Qiong Zhang et al.

multivariate time series forecastingmissing data handlingstructured state space modelsend-to-end forecasting+4

7

NeurIPS 2025arXiv:2506.10168

#76

Momentum Multi-Marginal Schrödinger Bridge Matching

Panagiotis Theodoropoulos, Augustinos Saravanos, Evangelos Theodorou et al.

schrödinger bridge matchingmulti-marginal optimal controlmeasure-valued splinesstochastic bridges+4

NeurIPS 2025arXiv:2505.17761

#77

Structured Linear CDEs: Maximally Expressive and Parallel-in-Time Sequence Models

Benjamin Walker, Lingyi Yang, Nicola Muca Cirone et al.

controlled differential equationsstate-transition matricessequence modelingparallel-in-time computation+3

AAAI 2024arXiv:2402.14380

#78

MambaVLT: Time-Evolving Multimodal State Space Model for Vision-Language Tracking

Xinqi Liu, Li Zhou, Zikun Zhou et al.

OST-Bench: Evaluating the Capabilities of MLLMs in Online Spatio-temporal Scene Understanding

Jingli Lin, Chenming Zhu, Runsen Xu et al.

RadarMOSEVE: A Spatial-Temporal Transformer Network for Radar-Only Moving Object Segmentation and Ego-Velocity Estimation

Changsong Pang, Xieyuanli Chen, Yimin Liu et al.

moving object segmentationego-velocity estimationradar point cloudsspatial-temporal transformer+4

ICLR 2025arXiv:2405.19036

#81

Efficient Hybrid Language Model Compression through Group-Aware SSM Pruning

Ali Taghibakhshi, Sharath Turuvekere Sreenivas, Saurav Muralidharan et al.

State Space Models are Provably Comparable to Transformers in Dynamic Token Selection

Naoki Nishikawa, Taiji Suzuki

state space modelssequence modelingdynamic token selectionnonlinear layers+2

ICLR 2025arXiv:2411.19455

#83

SaMam: Style-aware State Space Model for Arbitrary Image Style Transfer

Hongda Liu, Longguang Wang, Ye Zhang et al.

Autocorrelation Matters: Understanding the Role of Initialization Schemes for State Space Models

Fusheng Liu, Qianxiao Li

state space modelsinitialization schemesautocorrelation analysistimescale characterization+3

CVPR 2025arXiv:2503.19913

#85

PartRM: Modeling Part-Level Dynamics with Large Cross-State Reconstruction Model

Mingju Gao, Yike Pan, Huan-ang Gao et al.

part-level dynamics4d reconstruction frameworkmulti-view images3d gaussian reconstruction+4

NeurIPS 2025arXiv:2505.24003

#86

Parameter-Efficient Fine-Tuning of State Space Models

Kevin Galim, Wonjun Kang, Yuchen Zeng et al.

GroupMamba: Efficient Group-Based Visual State Space Model

Abdelrahman Shaker, Syed Talal Wasim, Salman Khan et al.

SAE-V: Interpreting Multimodal Models for Enhanced Alignment

Hantao Lou, Changye Li, Jiaming Ji et al.

SEGS-SLAM: Structure-enhanced 3D Gaussian Splatting SLAM with Appearance Embedding

Tianci Wen, Zhiang Liu, Yongchun Fang

MOSCATO: Predicting Multiple Object State Change Through Actions

Parnian Zameni, Yuhan Shen, Ehsan Elhamifar

Multi-Modal View Enhanced Large Vision Models for Long-Term Time Series Forecasting

ChengAo Shen, Wenchao Yu, Ziming Zhao et al.

long-term time series forecastingmulti-modal viewstrend-seasonal decompositionlarge vision models+2

5

ICCV 2025arXiv:2503.10959

#92

Learning Safe Action Models with Partial Observability

Hai Le, Brendan Juba, Roni Stern

Sable: a Performant, Efficient and Scalable Sequence Model for MARL

Omayma Mahjoub, Sasha Abramowitz, Ruan de Kock et al.

ZigzagPointMamba: Spatial-Semantic Mamba for Point Cloud Understanding

LinshuangDiao, Sensen Song, Yurong Qian et al.

SSAN: A Symbol Spatial-Aware Network for Handwritten Mathematical Expression Recognition

Haoran Zhang, Xiangdong Su, Xingxiang Zhou et al.

OuroMamba: A Data-Free Quantization Framework for Vision Mamba

Akshat Ramachandran, Mingyu Lee, Huan Xu et al.

vision mamba modelsdata-free quantizationpost-training quantizationcontrastive learning+3

4

NeurIPS 2025arXiv:2505.21717

#97

🎧MOSPA: Human Motion Generation Driven by Spatial Audio

Shuyang Xu, Zhiyang Dou, Mingyi Shi et al.

Scaling Up Liquid-Resistance Liquid-Capacitance Networks for Efficient Sequence Modeling

Mónika Farsang, Radu Grosu

sequence modelingrecurrent modelsstate-space layersgradient stability+3

4

#99

SBSC: Step-by-Step Coding for Improving Mathematical Olympiad Performance

Kunal Singh, Ankan Biswas, Sayandeep Bhowmick et al.

Epistemic Monte Carlo Tree Search

Yaniv Oren, Viliam Vadocz, Matthijs T. J. Spaan et al.

ICLR 2025

4