Most Cited 2025 &quot;hardware robotic control&quot; Papers

ICCV 2025arXiv:2503.07249

#14602

Text-IRSTD: Leveraging Semantic Text to Promote Infrared Small Target Detection in Complex Scenes

Feng Huang, Shuyuan Zheng, Zhaobing Qiu et al.

ICCV 2025arXiv:2507.19140

#14603

Balancing Conservatism and Aggressiveness: Prototype-Affinity Hybrid Network for Few-Shot Segmentation

Tianyu Zou, Shengwu Xiong, Ruilin Yao et al.

ICCV 2025arXiv:2412.02545

#14604

ShadowHack: Hacking Shadows via Luminance-Color Divide and Conquer

Jin Hu, Mingjia Li, Xiaojie Guo

NEURIPS 2025arXiv:2506.01899

#14605

The Complexity of Correlated Equilibria in Generalized Games

Martino Bernasconi, Matteo Castiglioni, Andrea Celli et al.

NEURIPS 2025arXiv:2508.20441

#14606

Uncovering the Spectral Bias in Diagonal State Space Models

Ruben Solozabal, Velibor Bojkovic, Hilal AlQuabeh et al.

NEURIPS 2025arXiv:2411.12977

#14607

MindForge: Empowering Embodied Agents with Theory of Mind for Lifelong Cultural Learning

Mircea Lică, Ojas Shirekar, Baptiste Colle et al.

NEURIPS 2025spotlightarXiv:2505.10646

#14608

Accelerating Visual-Policy Learning through Parallel Differentiable Simulation

Haoxiang You, Yilang Liu, Ian Abraham

ICCV 2025arXiv:2412.02890

#14609

EvRT-DETR: Latent Space Adaptation of Image Detectors for Event-based Vision

Dmitrii Torbunov, Yihui Ren, Animesh Ghose et al.

NEURIPS 2025oralarXiv:2507.17336

#14610

Temporal Smoothness-Aware Rate-Distortion Optimized 4D Gaussian Splatting

Hyeongmin Lee, Kyungjune Baek

NEURIPS 2025arXiv:2510.21144

#14611

NeuroGenPoisoning: Neuron-Guided Attacks on Retrieval-Augmented Generation of LLM via Genetic Optimization of External Knowledge

Hanyu Zhu, Lance Fiondella, Jiawei Yuan et al.

NEURIPS 2025spotlightarXiv:2509.17514

#14612

Achilles' Heel of Mamba: Essential difficulties of the Mamba architecture demonstrated by synthetic data

Tianyi Chen, Pengxiao Lin, Zhiwei Wang et al.

ICCV 2025arXiv:2503.20309

#14613

Instruction-Oriented Preference Alignment for Enhancing Multi-Modal Comprehension Capability of MLLMs

Zitian Wang, Yue Liao, RONG KANG et al.

ICCV 2025arXiv:2510.12679

#14614

MCOP: Multi-UAV Collaborative Occupancy Prediction

Zefu Lin, Wenbo Chen, Xiaojuan Jin et al.

ICCV 2025arXiv:2508.12384

#14615

ViT-EnsembleAttack: Augmenting Ensemble Models for Stronger Adversarial Transferability in Vision Transformers

Hanwen Cao, Haobo Lu, Xiaosen Wang et al.

NEURIPS 2025arXiv:2510.04057

#14616

MetaFind: Scene-Aware 3D Asset Retrieval for Coherent Metaverse Scene Generation

Zhenyu Pan, Yucheng Lu, Han Liu

NEURIPS 2025arXiv:2508.15069

#14617

Sampling by averaging: A multiscale approach to score estimation

Paula Cordero-Encinar, Andrew Duncan, Sebastian Reich et al.

NEURIPS 2025arXiv:2410.12609

#14618

Towards Graph Foundation Models: Training on Knowledge Graphs Enables Transferability to General Graphs

Kai Wang, Siqiang Luo, Caihua Shan et al.

NEURIPS 2025arXiv:2510.21148

#14619

How to Auto-optimize Prompts for Domain Tasks? Adaptive Prompting and Reasoning through Evolutionary Domain Knowledge Adaptation

Yang Zhao, Pu Wang, Hao Frank Yang

ICCV 2025highlightarXiv:2509.26639

#14620

Benchmarking Egocentric Visual-Inertial SLAM at City Scale

Anusha Krishnan, Shaohui Liu, Paul-Edouard Sarlin et al.

CVPR 2025arXiv:2502.16911

#14621

SPARC: Score Prompting and Adaptive Fusion for Zero-Shot Multi-Label Recognition in Vision-Language Models

Kevin Miller, Aditya Gangrade, Samarth Mishra et al.

NEURIPS 2025arXiv:2506.20977

#14622

From Cradle to Cane: A Two-Pass Framework for High-Fidelity Lifespan Face Aging

Tao Liu, Dafeng Zhang, Gengchen Li et al.

NEURIPS 2025oralarXiv:2505.14253

#14623

Wavelet Canonical Coherence for Nonstationary Signals

Haibo Wu, Marina Knight, Keiland Cooper et al.

NEURIPS 2025spotlightarXiv:2506.01356

#14624

Two‑Stage Learning of Stabilizing Neural Controllers via Zubov Sampling and Iterative Domain Expansion

Haoyu Li, Xiangru Zhong, Bin Hu et al.

#14625

Minimal Interaction Seperated Tuning: A New Paradigm for Visual Adaptation

Ningyuan Tang, Minghao Fu, Jianxin Wu

#14626

Serialization based Point Cloud Oversegmentation

chenghui Lu, Dilong Li, Jianlong Kwan et al.

CVPR 2025arXiv:2506.07750

#14627

Difference Inversion: Interpolate and Isolate the Difference with Token Consistency for Image Analogy Generation

Hyunsoo Kim, Donghyun Kim, Suhyun Kim

#14628

Revisiting Fairness in Multitask Learning: A Performance-Driven Approach for Variance Reduction

Xiaohan Qin, Xiaoxing Wang, Junchi Yan

NEURIPS 2025oralarXiv:2512.06866

#14629

Less Is More, but Where? Dynamic Token Compression via LLM-Guided Keyframe Prior

Yulin Li, Haokun GUI, Ziyang Fan et al.

NEURIPS 2025arXiv:2506.08220

#14630

Jamais Vu: Exposing the Generalization Gap in Supervised Semantic Correspondence

Octave Mariotti, Zhipeng Du, Yash Bhalgat et al.

NEURIPS 2025arXiv:2510.21311

#14631

FineRS: Fine-grained Reasoning and Segmentation of Small Objects with Reinforcement Learning

Lu Zhang, Jiazuo Yu, Haomiao Xiong et al.

NEURIPS 2025arXiv:2503.24357

#14632

InstructRestore: Region-Customized Image Restoration with Human Instructions

Shuaizheng Liu, Jianqi Ma, Lingchen Sun et al.

NEURIPS 2025arXiv:2510.21417

#14633

Self-diffusion for Solving Inverse Problems

Guanxiong Luo, Shoujin Huang

#14634

Progressive Artwork Outpainting via Latent Diffusion Models

Dae-Young Song, Jung-Jae Yu, Donghyeon Cho

ICCV 2025arXiv:2506.21037

#14635

Reinforcement Learning-Guided Data Selection via Redundancy Assessment

Suorong Yang, Peijia Li, Furao Shen et al.

ICCV 2025arXiv:2508.02168

#14636

After the Party: Navigating the Mapping From Color to Ambient Lighting

Florin-Alexandru Vasluianu, Tim Seizinger, Zongwei Wu et al.

NEURIPS 2025arXiv:2508.18903

#14637

Distance-informed Neural Processes

Aishwarya Venkataramanan, Joachim Denzler

ICCV 2025arXiv:2507.22522

#14638

Recognizing Actions from Robotic View for Natural Human-Robot Interaction

Ziyi Wang, Peiming Li, Hong Liu et al.

NEURIPS 2025arXiv:2505.18601

#14639

Flex-Judge: Text-Only Reasoning Unleashes Zero-Shot Multimodal Evaluators

Jongwoo Ko, Sungnyun Kim, Sungwoo Cho et al.

NEURIPS 2025arXiv:2502.03604

#14640

Bilevel ZOFO: Efficient LLM Fine-Tuning and Meta-Training

Reza Shirkavand, Peiran Yu, Qi He et al.

ICCV 2025arXiv:2508.14411

#14641

A Real-world Display Inverse Rendering Dataset

Seokjun Choi, Hoon-Gyu Chung, Yujin Jeon et al.

ICCV 2025arXiv:2503.17226

#14642

DDB: Diffusion Driven Balancing to Address Spurious Correlations

Aryan Yazdan Parast, Basim Azam, Naveed Akhtar

NEURIPS 2025arXiv:2508.10866

#14643

Efficiently Verifiable Proofs of Data Attribution

Ari Karchmer, Seth Neel, Martin Pawelczyk

NEURIPS 2025arXiv:2505.05082

#14644

ItDPDM: Information-Theoretic Discrete Poisson Diffusion Model

Sagnik Bhattacharya, Abhiram Gorle, Ahsan Bilal et al.

ICCV 2025highlightarXiv:2506.23618

#14645

TurboVSR: Fantastic Video Upscalers and Where to Find Them

Zhongdao Wang, Guodongfang Zhao, Jingjing Ren et al.

NEURIPS 2025arXiv:2512.08358

#14646

TrackingWorld: World-centric Monocular 3D Tracking of Almost All Pixels

Jiahao Lu, Weitao Xiong, Jiacheng Deng et al.

ICCV 2025arXiv:2509.20022

#14647

PS3: A Multimodal Transformer Integrating Pathology Reports with Histology Images and Biological Pathways for Cancer Survival Prediction

Manahil Raza, Ayesha Azam, Talha Qaiser et al.

NEURIPS 2025arXiv:2505.00812

#14648

Handling Label Noise via Instance-Level Difficulty Modeling and Dynamic Optimization

Kuan Zhang, Chengliang Chai, Jingzhe Xu et al.

NEURIPS 2025arXiv:2506.03777

#14649

FedFACT: A Provable Framework for Controllable Group-Fairness Calibration in Federated Learning

Li Zhang, Zhongxuan Han, XiaoHua Feng et al.

ICCV 2025arXiv:2505.10641

#14650

FRET: Feature Redundancy Elimination for Test Time Adaptation

Linjing You, Jiabao Lu, Xiayuan Huang et al.

#14651

Tune-Your-Style: Intensity-tunable 3D Style Transfer with Gaussian Splatting

Yian Zhao, rushi ye, Ruochong Zheng et al.

ICCV 2025arXiv:2411.17580

#14652

Revisiting Point Cloud Completion: Are We Ready For The Real-World?

Stuti Pathak, Prashant Kumar, Dheeraj Baiju et al.

NEURIPS 2025arXiv:2411.00066

#14653

Interpretable Next-token Prediction via the Generalized Induction Head

Eunji Kim, Sriya Mantena, Weiwei Yang et al.

NEURIPS 2025arXiv:2506.11357

#14654

Generalization Bound of Gradient Flow through Training Trajectory and Data-dependent Kernel

Yilan Chen, Zhichao Wang, Wei Huang et al.

NEURIPS 2025arXiv:2510.20978

#14655

A Geometric Analysis of PCA

Ayoub El Hanchi, Murat Erdogdu, Chris Maddison

CVPR 2025arXiv:2503.02388

#14656

PIDLoc: Cross-View Pose Optimization Network Inspired by PID Controllers

Wooju Lee, Juhye Park, Dasol Hong et al.

NEURIPS 2025oralarXiv:2505.17637

#14657

Causal Spatio-Temporal Prediction: An Effective and Efficient Multi-Modal Approach

Yuting Huang, Ziquan Fang, Zhihao Zeng et al.

CVPR 2025arXiv:2503.18134

#14658

An Image-like Diffusion Method for Human-Object Interaction Detection

Xiaofei Hui, Haoxuan Qu, Hossein Rahmani et al.

ICCV 2025arXiv:2411.15513

#14659

SPA: Efficient User-Preference Alignment against Uncertainty in Medical Image Segmentation

Jiayuan Zhu, Junde Wu, Cheng Ouyang et al.

#14660

Automatic Spectral Calibration of Hyperspectral Images: Method, Dataset and Benchmark

Zhuoran Du, Shaodi You, Cheng Cheng et al.

NEURIPS 2025oralarXiv:2510.15382

#14661

Towards Robust Zero-Shot Reinforcement Learning

Kexin ZHENG, Lauriane Teyssier, Yinan Zheng et al.

#14662

Unified Reconstruction of Static and Dynamic Scenes from Events

Qiyao Gao, Peiqi Duan, Hanyue Lou et al.

CVPR 2025highlight

NEURIPS 2025arXiv:2511.14030

#14663

Training-free Detection of AI-generated images via Cropping Robustness

Sungik Choi, Hankook Lee, Moontae Lee

NEURIPS 2025arXiv:2502.18709

#14664

Bandit and Delayed Feedback in Online Structured Prediction

Yuki Shibukawa, Taira Tsuchiya, Shinsaku Sakaue et al.

NEURIPS 2025spotlightarXiv:2506.12693

#14665

Zero-shot Denoising via Neural Compression: Theoretical and algorithmic framework

Ali Zafari, Xi Chen, Shirin Jalali

NEURIPS 2025arXiv:2510.20217

#14666

EditInfinity: Image Editing with Binary-Quantized Generative Models

Jiahuan Wang, Yuxin Chen, Jun Yu et al.

CVPR 2025highlightarXiv:2504.20403

#14667

Creating Your Editable 3D Photorealistic Avatar with Tetrahedron-constrained Gaussian Splatting

Hanxi Liu, Yifang Men, Zhouhui Lian

NEURIPS 2025arXiv:2510.17489

#14668

DETree: DEtecting Human-AI Collaborative Texts via Tree-Structured Hierarchical Representation Learning

Yongxin He, Shan Zhang, Yixuan Cao et al.

#14669

A Generalized Binary Tree Mechanism for Private Approximation of All-Pair Shortest Distances

Zongrui Zou, Chenglin Fan, Michael Dinitz et al.

NEURIPS 2025

CVPR 2025arXiv:2504.10007

#14670

Balancing Two Classifiers via A Simplex ETF Structure for Model Calibration

Jiani Ni, He Zhao, Jintong Gao et al.

NEURIPS 2025arXiv:2505.17323

#14671

Partner Modelling Emerges in Recurrent Agents (But Only When It Matters)

Ruaridh Mon-Williams, Max Taylor-Davies, Elizabeth Mieczkowski et al.

NEURIPS 2025arXiv:2509.23127

#14672

Statistical Inference for Gradient Boosting Regression

Haimo Fang, Kevin Tan, Giles Hooker

NEURIPS 2025arXiv:2505.17260

#14673

The Rise of Parameter Specialization for Knowledge Storage in Large Language Models

Yihuai Hong, Yiran Zhao, Wei Tang et al.

ICCV 2025arXiv:2506.16852

#14674

Controllable and Expressive One-Shot Video Head Swapping

Chaonan Ji, Jinwei Qi, Peng Zhang et al.

#14675

Dynamic Group Normalization: Spatio-Temporal Adaptation to Evolving Data Statistics

Yair Smadar, Assaf Hoogi

NEURIPS 2025arXiv:2510.25146

#14676

EA3D: Online Open-World 3D Object Extraction from Streaming Videos

Xiaoyu Zhou, Jingqi Wang, Yuang Jia et al.

NEURIPS 2025arXiv:2507.02275

#14677

It’s Hard to Be Normal: The Impact of Noise on Structure-agnostic Estimation

Jikai Jin, Lester Mackey, Vasilis Syrgkanis

NEURIPS 2025arXiv:2511.00033

#14678

STRIDER: Navigation via Instruction-Aligned Structural Decision Space Optimization

Diqi He, Xuehao Gao, Hao Li et al.

ICCV 2025arXiv:2507.00392

#14679

Learning Dense Feature Matching via Lifting Single 2D Image to 3D Space

Yingping Liang, Yutao Hu, Wenqi Shao et al.

ICCV 2025arXiv:2509.12894

#14680

DialNav: Multi-turn Dialog Navigation with a Remote Guide

Leekyeung Han, Hyunji Min, Gyeom Hwangbo et al.

NEURIPS 2025arXiv:2505.18046

#14681

Learning with Restricted Boltzmann Machines: Asymptotics of AMP and GD in High Dimensions

Yizhou Xu, Florent Krzakala, Lenka Zdeborová

ICCV 2025arXiv:2509.14958

#14682

Seeing 3D Through 2D Lenses: 3D Few-Shot Class-Incremental Learning via Cross-Modal Geometric Rectification

Tuo Xiang, Xuemiao Xu, Bangzhen Liu et al.

NEURIPS 2025spotlightarXiv:2512.01352

#14683

OpenBox: Annotate Any Bounding Boxes in 3D

In-Jae Lee, Mungyeom Kim, Kwonyoung Ryu et al.

ICCV 2025arXiv:2504.11024

#14684

Easy3D: A Simple Yet Effective Method for 3D Interactive Segmentation

Andrea Simonelli, Norman Müller, Peter Kontschieder

ICCV 2025arXiv:2509.07782

#14685

RayGaussX: Accelerating Gaussian-Based Ray Marching for Real-Time and High-Quality Novel View Synthesis

Hugo Blanc, Jean-Emmanuel Deschaud, Alexis Paljic

NEURIPS 2025arXiv:2507.14312

#14686

CLIPTTA: Robust Contrastive Vision-Language Test-Time Adaptation

Marc Lafon, Gustavo Vargas Hakim, Clément Rambour et al.

NEURIPS 2025spotlightarXiv:2502.13692

#14687

Tight Generalization Bounds for Large-Margin Halfspaces

Kasper Green Larsen, Natascha Schalburg

CVPR 2025arXiv:2411.16199

#14688

VIRES: Video Instance Repainting via Sketch and Text Guided Generation

Shuchen Weng, Haojie Zheng, Peixuan Zhang et al.

NEURIPS 2025arXiv:2507.03340

#14689

Degrees of Freedom for Linear Attention: Distilling Softmax Attention with Optimal Feature Efficiency

Naoki Nishikawa, Rei Higuchi, Taiji Suzuki

NEURIPS 2025oralarXiv:2511.03168

#14690

UnCLe: Towards Scalable Dynamic Causal Discovery in Non-linear Temporal Systems

Tingzhu Bi, Yicheng Pan, Xinrui Jiang et al.

NEURIPS 2025arXiv:2509.23373

#14691

Graph Your Own Prompt

Xi Ding, Lei Wang, Piotr Koniusz et al.

#14692

Video Language Model Pretraining with Spatio-temporal Masking

Yue Wu, Zhaobo Qi, Junshu Sun et al.

NEURIPS 2025arXiv:2507.03779

#14693

FastDINOv2: Frequency Based Curriculum Learning Improves Robustness and Training Speed

Jiaqi Zhang, Juntuo Wang, Zhixin Sun et al.

ICCV 2025highlightarXiv:2506.21042

#14694

Boosting Domain Generalized and Adaptive Detection with Diffusion Models: Fitness, Generalization, and Transferability

Boyong He, Yuxiang Ji, Zhuoyue Tan et al.

ICCV 2025arXiv:2510.21114

#14695

Controllable-LPMoE: Adapting to Challenging Object Segmentation via Dynamic Local Priors from Mixture-of-Experts

Yanguang Sun, Jiawei Lian, jian Yang et al.

NEURIPS 2025arXiv:2505.22494

#14696

ProSpero: Active Learning for Robust Protein Design Beyond Wild-Type Neighborhoods

Michal Kmicikiewicz, Vincent Fortuin, Ewa Szczurek

ICCV 2025arXiv:2503.11051

#14697

Towards Privacy-preserved Pre-training of Remote Sensing Foundation Models with Federated Mutual-guidance Learning

Jieyi Tan, Chengwei Zhang, Bo Dang et al.

#14698

Pinpointing Attention-Causal Communication in Language Models

Gabriel Franco, Mark Crovella

NEURIPS 2025

#14699

Towards Cost-Effective Learning: A Synergy of Semi-Supervised and Active Learning

Tianxiang Yin, Ningzhong Liu, Han Sun

#14700

The Photographer's Eye: Teaching Multimodal Large Language Models to See, and Critique Like Photographers

Daiqing Qi, Handong Zhao, Jing Shi et al.

NEURIPS 2025spotlightarXiv:2510.24884

#14701

Aggregation Hides Out-of-Distribution Generalization Failures from Spurious Correlations

Olawale Salaudeen, Haoran Zhang, Kumail Alhamoud et al.

ICCV 2025arXiv:2507.12135

#14702

Learning Pixel-adaptive Multi-layer Perceptrons for Real-time Image Enhancement

Junyu Lou, Xiaorui Zhao, Kexuan Shi et al.

NEURIPS 2025arXiv:2510.25094

#14703

Visual Diversity and Region-aware Prompt Learning for Zero-shot HOI Detection

Chanhyeong Yang, Taehoon song, Jihwan Park et al.

NEURIPS 2025arXiv:2509.13866

#14704

Masked Diffusion Models as Energy Minimization

Sitong Chen, Shen Nie, Jiacheng Sun et al.

ICCV 2025arXiv:2510.10584

#14705

Equipping Vision Foundation Model with Mixture of Experts for Out-of-Distribution Detection

Shizhen Zhao, Jiahui Liu, Xin Wen et al.

ICCV 2025arXiv:2501.06927

#14706

CULTURE3D: A Large-Scale and Diverse Dataset of Cultural Landmarks and Terrains for Gaussian-Based Scene Rendering

xinyi zheng, Steve Zhang, Weizhe Lin et al.

NEURIPS 2025arXiv:2503.04046

#14707

Continual Optimization with Symmetry Teleportation for Multi-Task Learning

Zhipeng Zhou, Ziqiao Meng, Pengcheng Wu et al.

ICCV 2025arXiv:2508.08811

#14708

Revisiting Efficient Semantic Segmentation: Learning Offsets for Better Spatial and Class Feature Alignment

Shi-Chen Zhang, Yunheng Li, Yu-Huan Wu et al.

CVPR 2025arXiv:2503.23030

#14709

Visual and Semantic Prompt Collaboration for Generalized Zero-Shot Learning

Huajie Jiang, Zhengxian Li, Xiaohan Yu et al.

NEURIPS 2025spotlightarXiv:2511.22121

#14710

Cue3D: Quantifying the Role of Image Cues in Single-Image 3D Generation

Xiang Li, Zirui Wang, Zixuan Huang et al.

NEURIPS 2025arXiv:2511.22664

#14711

VaMP: Variational Multi-Modal Prompt Learning for Vision-Language Models

Silin Cheng, Kai Han

#14712

Pseudo-SD: Pseudo Controlled Stable Diffusion for Semi-Supervised and Cross-Domain Semantic Segmentation

Dong Zhao, Qi Zang, Shuang Wang et al.

CVPR 2025arXiv:2503.17117

#14713

A New Statistical Model of Star Speckles for Learning to Detect and Characterize Exoplanets in Direct Imaging Observations

Theo Bodrito, Olivier Flasseur, Julien Mairal et al.

NEURIPS 2025arXiv:2507.17657

#14714

Attention (as Discrete-Time Markov) Chains

Yotam Erel, Olaf Dünkel, Rishabh Dabral et al.

ICCV 2025arXiv:2507.16251

#14715

HoliTracer: Holistic Vectorization of Geographic Objects from Large-Size Remote Sensing Imagery

Yu Wang, Bo Dang, Wanchun Li et al.

NEURIPS 2025arXiv:2505.17581

#14716

MODEM: A Morton-Order Degradation Estimation Mechanism for Adverse Weather Image Recovery

Hainuo Wang, Qiming Hu, Xiaojie Guo

NEURIPS 2025arXiv:2512.04310

#14717

RNNs perform task computations by dynamically warping neural representations

Arthur Pellegrino, Angus Chadwick

NEURIPS 2025arXiv:2511.00833

#14718

Linear Differential Vision Transformer: Learning Visual Contrasts via Pairwise Differentials

Yifan Pu, Jixuan Ying, Qixiu Li et al.

NEURIPS 2025arXiv:2510.16869

#14719

No-Regret Online Autobidding Algorithms in First-price Auctions

Yilin LI, Yuan Deng, Wei Tang et al.

CVPR 2025arXiv:2504.09966

#14720

SemiETS: Integrating Spatial and Content Consistencies for Semi-Supervised End-to-end Text Spotting

Dongliang Luo, Hanshen Zhu, Ziyang Zhang et al.

ICCV 2025arXiv:2506.23352

#14721

GeoProg3D: Compositional Visual Reasoning for City-Scale 3D Language Fields

Shunsuke Yasuki, Taiki Miyanishi, Nakamasa Inoue et al.

ICCV 2025arXiv:2411.18651

#14722

Verbalized Representation Learning for Interpretable Few-Shot Generalization

Cheng-Fu Yang, Da Yin, Wenbo Hu et al.

NEURIPS 2025arXiv:2505.21749

#14723

Revisiting Bi-Linear State Transitions in Recurrent Neural Networks

Reza Ebrahimi, Roland Memisevic

NEURIPS 2025spotlightarXiv:2505.18636

#14724

Asymmetric Duos: Sidekicks Improve Uncertainty

Tim G. Zhou, Evan Shelhamer, Geoff Pleiss

ICCV 2025arXiv:2507.03504

#14725

Information-Bottleneck Driven Binary Neural Network for Change Detection

Kaijie Yin, Zhiyuan Zhang, Shu Kong et al.

NEURIPS 2025arXiv:2404.15617

#14726

A Differential and Pointwise Control Approach to Reinforcement Learning

Minh Nguyen, Chandrajit Bajaj

ICCV 2025arXiv:2507.19188

#14727

VisHall3D: Monocular Semantic Scene Completion from Reconstructing the Visible Regions to Hallucinating the Invisible Regions

Haoang Lu, Yuanqi Su, Xiaoning Zhang et al.

NEURIPS 2025arXiv:2508.15103

#14728

Equi-mRNA: Protein Translation Equivariant Encoding for mRNA Language Models

Mehdi Yazdani-Jahromi, Ali Khodabandeh Yalabadi, Ozlem Garibay

ICCV 2025arXiv:2508.00557

#14729

Training-Free Class Purification for Open-Vocabulary Semantic Segmentation

Qi Chen, Lingxiao Yang, Yun Chen et al.

CVPR 2025arXiv:2303.16078

#14730

Practical Solutions to the Relative Pose of Three Calibrated Cameras

Charalambos Tzamos, Viktor Kocur, Yaqing Ding et al.

CVPR 2025arXiv:2504.06389

#14731

SemiDAViL: Semi-supervised Domain Adaptation with Vision-Language Guidance for Semantic Segmentation

Hritam Basak, Zhaozheng Yin

CVPR 2025arXiv:2504.01128

#14732

RipVIS: Rip Currents Video Instance Segmentation Benchmark for Beach Monitoring and Safety

Andrei Dumitriu, Florin Tatui, Florin Miron et al.

NEURIPS 2025arXiv:2509.14722

#14733

Towards Pre-trained Graph Condensation via Optimal Transport

Yeyu Yan, Shuai Zheng, Wenjun Hui et al.

CVPR 2025highlightarXiv:2411.18335

#14734

HELVIPAD: A Real-World Dataset for Omnidirectional Stereo Depth Estimation

Mehdi Zayene, Albias Havolli, Jannik Endres et al.

NEURIPS 2025spotlightarXiv:2505.21828

#14735

SAGE-Eval: Evaluating LLMs for Systematic Generalizations of Safety Facts

Yueh-Han Chen, Guy Davidson, Brenden Lake

NEURIPS 2025arXiv:2504.06042

#14736

An Adaptive Algorithm for Bilevel Optimization on Riemannian Manifolds

Xu Shi, Rufeng Xiao, Rujun Jiang

ICCV 2025arXiv:2507.18366

#14737

Evidential Knowledge Distillation

Liangyu Xiang, Junyu Gao, Changsheng Xu

ICCV 2025arXiv:2412.06458

#14738

Pruning All-Rounder: Rethinking and Improving Inference Efficiency for Large Vision Language Models

Wei Suo, Ji Ma, Mengyang Sun et al.

ICCV 2025arXiv:2509.01610

#14739

Improving Large Vision and Language Models by Learning from a Panel of Peers

Jefferson Hernandez, Jing Shi, Simon Jenni et al.

NEURIPS 2025spotlightarXiv:2412.08843

#14740

Precise Asymptotics and Refined Regret of Variance-Aware UCB

Yingying Fan, Yuxuan Han, Jinchi Lv et al.

NEURIPS 2025arXiv:2510.09343

#14741

Enhancing Infrared Vision: Progressive Prompt Fusion Network and Benchmark

Jinyuan Liu, Zihang Chen, Zhu Liu et al.

NEURIPS 2025spotlightarXiv:2511.16666

#14742

SceneDesigner: Controllable Multi-Object Image Generation with 9-DoF Pose Manipulation

Zhenyuan Qin, Xincheng Shuai, Henghui Ding

ICCV 2025arXiv:2506.22979

#14743

Probabilistic Prototype Calibration of Vision-language Models for Generalized Few-shot Semantic Segmentation

Jie Liu, Jiayi Shen, Pan Zhou et al.

NEURIPS 2025arXiv:2506.20025

#14744

Thumb on the Scale: Optimal Loss Weighting in Last Layer Retraining

Nathan Stromberg, Christos Thrampoulidis, Lalitha Sankar

CVPR 2025arXiv:2501.04666

#14745

Enhancing Virtual Try-On with Synthetic Pairs and Error-Aware Noise Scheduling

Nannan Li, Kevin Shih, Bryan A. Plummer

NEURIPS 2025arXiv:2509.25863

#14746

MAPLE: Multi-scale Attribute-enhanced Prompt Learning for Few-shot Whole Slide Image Classification

Junjie Zhou, WEI SHAO, Yagao Yue et al.

NEURIPS 2025arXiv:2502.04979

#14747

Prompt Tuning Decision Transformers with Structured and Scalable Bandits

Finn Rietz, Oleg Smirnov, Sara Karimi et al.

NEURIPS 2025arXiv:2510.22127

#14748

Mint: A Simple Test-Time Adaptation of Vision-Language Models against Common Corruptions

Wenxuan Bao, Ruxi Deng, Jingrui He

NEURIPS 2025arXiv:2505.06709

#14749

Beyond $\tilde{O}(\sqrt{T})$ Constraint Violation for Online Convex Optimization with Adversarial Constraints

Abhishek Sinha, Rahul Vaze

NEURIPS 2025arXiv:2510.17457

#14750

Deeper with Riemannian Geometry: Overcoming Oversmoothing and Oversquashing for Graph Foundation Models

Li Sun, Zhenhao Huang, Ming Zhang et al.

NEURIPS 2025arXiv:2310.13862

#14751

Competitive Advantage Attacks to Decentralized Federated Learning

Yuqi Jia, Minghong Fang, Neil Gong

NEURIPS 2025arXiv:2505.18473

#14752

PDPO: Parametric Density Path Optimization

Sebastian Gutierrez Hernandez, Peng Chen, Hao-Min Zhou

ICCV 2025arXiv:2509.15224

#14753

Depth AnyEvent: A Cross-Modal Distillation Paradigm for Event-Based Monocular Depth Estimation

Luca Bartolomei, Enrico Mannocci, Fabio Tosi et al.

ICCV 2025arXiv:2503.06089

#14754

Fish2Mesh Transformer: 3D Human Mesh Recovery from Egocentric Vision

Tianma Shen, Aditya Shrish Puranik, James Vong et al.

NEURIPS 2025arXiv:2506.15893

#14755

Formal Models of Active Learning from Contrastive Examples

Farnam Mansouri, Hans Simon, Adish Singla et al.

NEURIPS 2025arXiv:2505.23280

#14756

Holistic Large-Scale Scene Reconstruction via Mixed Gaussian Splatting

Chuandong Liu, Huijiao Wang, Lei YU et al.

NEURIPS 2025arXiv:2509.21526

#14757

TRiCo: Triadic Game-Theoretic Co-Training for Robust Semi-Supervised Learning

Hongyang He, Xinyuan Song, Yangfan He et al.

#14758

Optimizing Retrieval for RAG via Reinforced Contrastive Learning

Jiawei Zhou, Lei Chen

NEURIPS 2025

NEURIPS 2025spotlightarXiv:2509.08195

#14759

Sketched Gaussian Mechanism for Private Federated Learning

Qiaobo Li, Zhijie Chen, Arindam Banerjee

ICCV 2025arXiv:2508.12615

#14760

WIPES: Wavelet-based Visual Primitives

Wenhao Zhang, Hao Zhu, Delong Wu et al.

NEURIPS 2025arXiv:2505.22014

#14761

Learning in Compact Spaces with Approximately Normalized Transformer

Jörg Franke, Urs Spiegelhalter, Marianna Nezhurina et al.

NEURIPS 2025arXiv:2510.21111

#14762

PhysVLM-AVR: Active Visual Reasoning for Multimodal Large Language Models in Physical Environments

Weijie Zhou, Xuantang Xiong, Yi Peng et al.

#14763

DLFR-Gen: Diffusion-based Video Generation with Dynamic Latent Frame Rate

Zhihang Yuan, Rui Xie, Yuzhang Shang et al.

CVPR 2025arXiv:2503.15975

#14764

Acc3D: Accelerating Single Image to 3D Diffusion Models via Edge Consistency Guided Score Distillation

Kendong Liu, Zhiyu Zhu, Hui LIU et al.

NEURIPS 2025arXiv:2510.20218

#14765

High-order Interactions Modeling for Interpretable Multi-Agent Q-Learning

Qinyu Xu, Yuanyang Zhu, Xuefei Wu et al.

NEURIPS 2025oralarXiv:2509.04966

#14766

Neuro-Spectral Architectures for Causal Physics-Informed Networks

Arthur Bizzi, Leonardo Moreira, Márcio Marques et al.

ICCV 2025arXiv:2504.09426

#14767

BabyVLM: Data-Efficient Pretraining of VLMs Inspired by Infant Learning

Shengao Wang, Arjun Chandra, Aoming Liu et al.

NEURIPS 2025arXiv:2510.21952

#14768

Revisiting Orbital Minimization Method for Neural Operator Decomposition

Jongha (Jon) Ryu, Samuel Zhou, Gregory Wornell

NEURIPS 2025arXiv:2510.07723

#14769

SyncHuman: Synchronizing 2D and 3D Generative Models for Single-view Human Reconstruction

Wenyue Chen, Peng Li, Wangguandong Zheng et al.

NEURIPS 2025spotlightarXiv:2505.16251

#14770

Graph–Smoothed Bayesian Black-Box Shift Estimator and Its Information Geometry

Masanari Kimura

NEURIPS 2025arXiv:2503.02809

#14771

A Minimalist Example of Edge-of-Stability and Progressive Sharpening

Liming Liu, Zixuan Zhang, Simon Du et al.

NEURIPS 2025arXiv:2510.20134

#14772

Revisiting Logit Distributions for Reliable Out-of-Distribution Detection

Jiachen Liang, RuiBing Hou, Minyang Hu et al.

NEURIPS 2025oralarXiv:2505.12226

#14773

Shallow Flow Matching for Coarse-to-Fine Text-to-Speech Synthesis

Dong Yang, YIYI CAI, Yuki Saito et al.

NEURIPS 2025arXiv:2512.03000

#14774

DynamicVerse: A Physically-Aware Multimodal Framework for 4D World Modeling

Kairun Wen, Yuzhihuang, Runyu Chen et al.

NEURIPS 2025arXiv:2510.21142

#14775

In Silico Mapping of Visual Categorical Selectivity Across the Whole Brain

Ethan Hwang, Hossein Adeli, Wenxuan Guo et al.

NEURIPS 2025arXiv:2509.18208

#14776

Variational Task Vector Composition

Boyuan Zhang, Yingjun Du, Xiantong Zhen et al.

NEURIPS 2025arXiv:2506.02175

#14777

AI Debate Aids Assessment of Controversial Claims

Salman Rahman, Sheriff Issaka, Ashima Suvarna et al.

ICCV 2025arXiv:2508.17342

#14778

DanceEditor: Towards Iterative Editable Music-driven Dance Generation with Open-Vocabulary Descriptions

Hengyuan Zhang, Zhe Li, Xingqun Qi et al.

ICCV 2025arXiv:2506.23484

#14779

TAG-WM: Tamper-Aware Generative Image Watermarking via Diffusion Inversion Sensitivity

Yuzhuo Chen, Zehua Ma, Han Fang et al.

NEURIPS 2025arXiv:2511.05616

#14780

Personalized Image Editing in Text-to-Image Diffusion Models via Collaborative Direct Preference Optimization

Connor Dunlop, Matthew Zheng, Kavana Venkatesh et al.

#14781

GeRaF: Neural Geometry Reconstruction from Radio Frequency Signals

Jiachen Lu, Hailan Shanbhag, Haitham Al Hassanieh

NEURIPS 2025spotlight

CVPR 2025arXiv:2503.22537

#14782

LIM: Large Interpolator Model for Dynamic Reconstruction

Remy Sabathier, Niloy J. Mitra, David Novotny

NEURIPS 2025arXiv:2509.19282

#14783

OverLayBench: A Benchmark for Layout-to-Image Generation with Dense Overlaps

Bingnan Li, Chen-Yu Wang, Haiyang Xu et al.

NEURIPS 2025arXiv:2510.25132

#14784

EnzyControl: Adding Functional and Substrate-Specific Control for Enzyme Backbone Generation

Chao Song, ZHIYUAN LIU, Han Huang et al.

NEURIPS 2025arXiv:2511.02690

#14785

Curriculum Design for Trajectory-Constrained Agent: Compressing Chain-of-Thought Tokens in LLMs

Georgios Tzannetos, Parameswaran Kamalaruban, Adish Singla

ICCV 2025arXiv:2410.12342

#14786

Fuse Before Transfer: Knowledge Fusion for Heterogeneous Distillation

Guopeng Li, Qiang Wang, Ke Yan et al.

#14787

EnliveningGS: Active Locomotion of 3DGS

Siyuan Shen, Tianjia Shao, Kun Zhou et al.

ICCV 2025arXiv:2508.02134

#14788

Free-MoRef: Instantly Multiplexing Context Perception Capabilities of Video-MLLMs within Single Inference

KUO WANG, Quanlong Zheng, Junlin Xie et al.

#14789

CamPoint: Boosting Point Cloud Segmentation with Virtual Camera

Jianhui Zhang, Luo Yizhi, Zicheng Zhang et al.

ICCV 2025arXiv:2510.20726

#14790

AutoScape: Geometry-Consistent Long-Horizon Scene Generation

Jiacheng Chen, Ziyu Jiang, Mingfu Liang et al.

NEURIPS 2025spotlightarXiv:2507.07207

#14791

Scaling can lead to compositional generalization

Florian Redhardt, Yassir Akram, Simon Schug

NEURIPS 2025arXiv:2508.10899

#14792

A Dataset for Distilling Knowledge Priors from Literature for Therapeutic Design

Haydn Jones, Natalie Maus, Josh magnus Ludan et al.

NEURIPS 2025arXiv:2511.00423

#14793

Bootstrap Off-policy with World Model

Guojian Zhan, Likun Wang, Xiangteng Zhang et al.

ICCV 2025arXiv:2508.01835

#14794

Diffusion-based 3D Hand Motion Recovery with Intuitive Physics

Yufei Zhang, Zijun Cui, Jeffrey Kephart et al.

NEURIPS 2025arXiv:2504.10139

#14795

Conditional Distribution Compression via the Kernel Conditional Mean Embedding

Dominic Broadbent, Nick Whiteley, Robert Allison et al.

NEURIPS 2025arXiv:2509.23846

#14796

Adversarial Diffusion for Robust Reinforcement Learning

Daniele Foffano, Alessio Russo, Alexandre Proutiere

CVPR 2025arXiv:2412.01140

#14797

Dense Dispersed Structured Light for Hyperspectral 3D Imaging of Dynamic Scenes

Suhyun Shin, Seungwoo Yoon, Ryota Maeda et al.

NEURIPS 2025arXiv:2503.09395

#14798

Adjusted Count Quantification Learning on Graphs

Clemens Damke, Eyke Hüllermeier

NEURIPS 2025arXiv:2510.21441

#14799

OpenHype: Hyperbolic Embeddings for Hierarchical Open-Vocabulary Radiance Fields

Lisa Weijler, Sebastian Koch, Fabio Poiesi et al.

NEURIPS 2025arXiv:2512.11087

#14800

Clip-and-Verify: Linear Constraint-Driven Domain Clipping for Accelerating Neural Network Verification

Duo Zhou, Jorge Chavez, Hesun Chen et al.