Most Cited 2025 &quot;forward matrix deduction&quot; Papers

NEURIPS 2025oralarXiv:2506.09714

#12402

Auto-Compressing Networks

Evangelos Dorovatas, Georgios Paraskevopoulos, Alexandros Potamianos

#12403

CLIP-Adapted Region-to-Text Learning for Generative Open-Vocabulary Semantic Segmentation

Jiannan Ge, Lingxi Xie, Hongtao Xie et al.

CVPR 2025arXiv:2409.19425

#12404

Harnessing Frozen Unimodal Encoders for Flexible Multimodal Alignment

Mayug Maniparambil, Raiymbek Akshulakov, YASSER ABDELAZIZ DAHOU DJILALI et al.

NEURIPS 2025arXiv:2407.00611

#12405

StarTrail: Concentric Ring Sequence Parallelism for Efficient Near-Infinite-Context Transformer Model Training

Ziming Liu, Shaoyu Wang, Shenggan Cheng et al.

#12406

HORP: Human-Object Relation Priors Guided HOI Detection

Pei Geng, Jian Yang, Shanshan Zhang

ICCV 2025highlightarXiv:2508.00427

#12407

Contact-Aware Amodal Completion for Human-Object Interaction via Multi-Regional Inpainting

Seunggeun Chi, Pin-Hao Huang, Enna Sachdeva et al.

CVPR 2025arXiv:2503.14897

#12408

When Domain Generalization meets Generalized Category Discovery: An Adaptive Task-Arithmetic Driven Approach

Vaibhav Rathore, Shubhranil B, Saikat Dutta et al.

ICCV 2025arXiv:2503.13440

#12409

MaTVLM: Hybrid Mamba-Transformer for Efficient Vision-Language Modeling

Yingyue Li, Bencheng Liao, Wenyu Liu et al.

NEURIPS 2025arXiv:2310.16203

#12410

Multivariate Dynamic Mediation Analysis under a Reinforcement Learning Framework

Lan Luo, Chengchun Shi, Jitao Wang et al.

ICCV 2025arXiv:2507.09291

#12411

Supercharging Floorplan Localization with Semantic Rays

Yuval Grader, Hadar Averbuch-Elor

NEURIPS 2025arXiv:2510.10864

#12412

HeroFilter: Adaptive Spectral Graph Filter for Varying Heterophilic Relations

Shuaicheng Zhang, Haohui Wang, Junhong Lin et al.

NEURIPS 2025spotlightarXiv:2506.21028

#12413

TRIDENT: Tri-Modal Molecular Representation Learning with Taxonomic Annotations and Local Correspondence

Feng Jiang, Mangal Prakash, Hehuan Ma et al.

ICCV 2025arXiv:2408.14961

#12414

CVPT: Cross Visual Prompt Tuning

Lingyun Huang, Jianxu Mao, Junfei YI et al.

ICCV 2025arXiv:2507.04789

#12415

Training-Free Generation of Temporally Consistent Rewards from VLMs

Yinuo Zhao, Jiale Yuan, Zhiyuan Xu et al.

NEURIPS 2025arXiv:2506.04158

#12416

Image Editing As Programs with Diffusion Models

Yujia Hu, Songhua Liu, Zhenxiong Tan et al.

NEURIPS 2025arXiv:2502.03748

#12417

Rethinking Residual Distribution in Locate-then-Edit Model Editing

Xiaopeng Li, Shangwen Wang, Shasha Li et al.

NEURIPS 2025arXiv:2504.08809

#12418

Decoupling Contrastive Decoding: Robust Hallucination Mitigation in Multimodal Large Language Models

Wei Chen, Xin Yan, Bin Wen et al.

NEURIPS 2025arXiv:2506.06501

#12419

Optimal Rates in Continual Linear Regression via Increasing Regularization

Ran Levinstein, Amit Attia, Matan Schliserman et al.

ICCV 2025highlightarXiv:2507.23597

#12420

MoGA: 3D Generative Avatar Prior for Monocular Gaussian Avatar Reconstruction

Zijian Dong, Longteng Duan, Jie Song et al.

CVPR 2025arXiv:2412.18883

#12421

MotionMap: Representing Multimodality in Human Pose Forecasting

Reyhaneh Hosseininejad, Megh Shukla, Saeed Saadatnejad et al.

ICCV 2025arXiv:2501.07742

#12422

RePoseD: Efficient Relative Pose Estimation With Known Depth Information

Yaqing Ding, Viktor Kocur, VACLAV VAVRA et al.

ICCV 2025arXiv:2508.09000

#12423

UniConvNet: Expanding Effective Receptive Field while Maintaining Asymptotically Gaussian Distribution for ConvNets of Any Scale

Yuhao Wang, Wei Xi

CVPR 2025arXiv:2504.05499

#12424

Few-shot Personalized Scanpath Prediction

Ruoyu Xue, Jingyi Xu, Sounak Mondal et al.

ICCV 2025arXiv:2412.04715

#12425

Addressing Text Embedding Leakage in Diffusion-based Image Editing

Sunung Mun, Jinhwan Nam, Sunghyun Cho et al.

NEURIPS 2025arXiv:2503.16199

#12426

Deferring Concept Bottleneck Models: Learning to Defer Interventions to Inaccurate Experts

Andrea Pugnana, Riccardo Massidda, Francesco Giannini et al.

NEURIPS 2025arXiv:2506.10351

#12427

PhysioWave: A Multi-Scale Wavelet-Transformer for Physiological Signal Representation

Yanlong Chen, Mattia Orlandi, Pierangelo Rapa et al.

ICCV 2025arXiv:2507.16310

#12428

MotionShot: Adaptive Motion Transfer across Arbitrary Objects for Text-to-Video Generation

Yanchen Liu, Yanan SUN, Zhening Xing et al.

CVPR 2025arXiv:2503.23388

#12429

COSMIC: Clique-Oriented Semantic Multi-space Integration for Robust CLIP Test-Time Adaptation

Fanding Huang, Jingyan Jiang, Qinting Jiang et al.

CVPR 2025arXiv:2503.02841

#12430

Boltzmann Attention Sampling for Image Analysis with Small Objects

Theodore Zhao, Sid Kiblawi, Mu Wei et al.

NEURIPS 2025arXiv:2504.04675

#12431

HYPRL: Reinforcement Learning of Control Policies for Hyperproperties

Tzu-Han Hsu, Arshia Rafieioskouei, Borzoo Bonakdarpour

ICCV 2025arXiv:2506.21188

#12432

GroundFlow: A Plug-in Module for Temporal Reasoning on 3D Point Cloud Sequential Grounding

Zijun Lin, Shuting He, Cheston Tan et al.

CVPR 2025arXiv:2503.03132

#12433

Dynamic Neural Surfaces for Elastic 4D Shape Representation and Analysis

Awais Nizamani, Hamid Laga, Guanjin Wang et al.

ICCV 2025arXiv:2507.07883

#12434

SAMO: A Lightweight Sharpness-Aware Approach for Multi-Task Optimization with Joint Global-Local Perturbation

Hao Ban, Gokul Ram Subramani, Kaiyi Ji

ICCV 2025highlightarXiv:2507.12857

#12435

SCORE: Scene Context Matters in Open-Vocabulary Remote Sensing Instance Segmentation

Shiqi Huang, Shuting He, Huaiyuan Qin et al.

CVPR 2025arXiv:2412.08859

#12436

ViUniT: Visual Unit Tests for More Robust Visual Programming

Artemis Panagopoulou, Honglu Zhou, silvio savarese et al.

#12437

Learnable Feature Patches and Vectors for Boosting Low-light Image Enhancement without External Knowledge

Xiaogang Xu, Jiafei Wu, Qingsen Yan et al.

NEURIPS 2025spotlightarXiv:2506.24018

#12438

Bridging Theory and Practice in Link Representation with Graph Neural Networks

Veronica Lachi, Francesco Ferrini, Antonio Longa et al.

NEURIPS 2025arXiv:2509.18648

#12439

SPiDR: A Simple Approach for Zero-Shot Safety in Sim-to-Real Transfer

Yarden As, Chengrui (Ray) Qu, Benjamin Unger et al.

NEURIPS 2025arXiv:2508.00831

#12440

EngiBench: A Framework for Data-Driven Engineering Design Research

Florian Felten, Gabriel Apaza, Gerhard Bräunlich et al.

NEURIPS 2025arXiv:2510.24788

#12441

The Underappreciated Power of Vision Models for Graph Structural Understanding

Xinjian Zhao, Wei Pang, Zhongkai Xue et al.

NEURIPS 2025spotlightarXiv:2506.05530

#12442

Spectral Graph Neural Networks are Incomplete on Graphs with a Simple Spectrum

Snir Hordan, Maya Bechler-Speicher, Gur Lifshitz et al.

CVPR 2025arXiv:2504.09990

#12443

Correlative and Discriminative Label Grouping for Multi-Label Visual Prompt Tuning

Lei-Lei Ma, Shuo Xu, Ming-Kun Xie et al.

NEURIPS 2025arXiv:2506.20194

#12444

DuoGPT: Training-free Dual Sparsity through Activation-aware Pruning in LLMs

Ruokai Yin, Yuhang Li, Donghyun Lee et al.

ICCV 2025highlightarXiv:2507.12591

#12445

CT-ScanGaze: A Dataset and Baselines for 3D Volumetric Scanpath Modeling

Trong-Thang Pham, AKASH AWASTHI, Saba Khan et al.

NEURIPS 2025spotlightarXiv:2505.21955

#12446

Towards Comprehensive Scene Understanding: Integrating First and Third-Person Views for LVLMs

Insu Lee, Wooje Park, Jaeyun Jang et al.

NEURIPS 2025arXiv:2509.26391

#12447

MotionRAG: Motion Retrieval-Augmented Image-to-Video Generation

Chenhui Zhu, Yilu Wu, Shuai Wang et al.

NEURIPS 2025arXiv:2510.21935

#12448

AutoSciDACT: Automated Scientific Discovery through Contrastive Embedding and Hypothesis Testing

Sam Bright-Thonney, Christina Reissel, Gaia Grosso et al.

NEURIPS 2025arXiv:2506.16736

#12449

Optimism Without Regularization: Constant Regret in Zero-Sum Games

John Lazarsfeld, Georgios Piliouras, Ryann Sim et al.

ICCV 2025arXiv:2508.03742

#12450

Boosting Vision Semantic Density with Anatomy Normality Modeling for Medical Vision-language Pre-training

Weiwei Cao, Jianpeng Zhang, Zhongyi Shui et al.

CVPR 2025arXiv:2503.22163

#12451

T-CIL: Temperature Scaling using Adversarial Perturbation for Calibration in Class-Incremental Learning

Seong-Hyeon Hwang, Minsu Kim, Steven Euijong Whang

ICCV 2025arXiv:2508.10522

#12452

EgoMusic-driven Human Dance Motion Estimation with Skeleton Mamba

Quang Nguyen, Nhat Le, Baoru Huang et al.

ICCV 2025arXiv:2508.10297

#12453

InterSyn: Interleaved Learning for Dynamic Motion Synthesis in the Wild

Yiyi Ma, Yuanzhi Liang, Xiu Li et al.

#12454

FedWMSAM: Fast and Flat Federated Learning via Weighted Momentum and Sharpness-Aware Minimization

Tianle Li, Yongzhi Huang, Linshan Jiang et al.

NEURIPS 2025

NEURIPS 2025arXiv:2506.03355

#12455

Robustness in Both Domains: CLIP Needs a Robust Text Encoder

Elias Abad Rocamora, Christian Schlarmann, Naman Deep Singh et al.

NEURIPS 2025arXiv:2510.15152

#12456

Tail-Optimized Caching for LLM Inference

Wenxin Zhang, Yueying Li, Ciamac C Moallemi et al.

NEURIPS 2025arXiv:2505.18493

#12457

Statistical Inference under Performativity

Xiang Li, Yunai Li, Huiying Zhong et al.

CVPR 2025arXiv:2503.21003

#12458

Forensic Self-Descriptions Are All You Need for Zero-Shot Detection, Open-Set Source Attribution, and Clustering of AI-generated Images

Tai Nguyen, Aref Azizpour, Matthew Stamm

#12459

beta-FFT: Nonlinear Interpolation and Differentiated Training Strategies for Semi-Supervised Medical Image Segmentation

Ming Hu, Jianfu Yin, Zhuangzhuang Ma et al.

NEURIPS 2025arXiv:2511.20490

#12460

MTBBench: A Multimodal Sequential Clinical Decision-Making Benchmark in Oncology

Kiril Vasilev, Alexandre Misrahi, Eeshaan Jain et al.

NEURIPS 2025arXiv:2506.04536

#12461

NOBLE - Neural Operator with Biologically-informed Latent Embeddings to Capture Experimental Variability in Biological Neuron Models

Luca Ghafourpour, Valentin Duruisseaux, Bahareh Tolooshams et al.

CVPR 2025arXiv:2503.24282

#12462

Style Quantization for Data-Efficient GAN Training

Jian Wang, Xin Lan, Ji-Zhe Zhou et al.

CVPR 2025arXiv:2503.18312

#12463

Diff-Palm: Realistic Palmprint Generation with Polynomial Creases and Intra-Class Variation Controllable Diffusion Models

Jianlong Jin, Chenglong Zhao, Ruixin Zhang et al.

NEURIPS 2025arXiv:2505.16322

#12464

AdaSTaR: Adaptive Data Sampling for Training Self-Taught Reasoners

Reiss Koh, Wonbeen Oh, Jaein Jang et al.

#12465

Test-Time Fine-Tuning of Image Compression Models for Multi-Task Adaptability

Unki Park, Seongmoon Jeong, Jang Youngchan et al.

CVPR 2025arXiv:2504.07758

#12466

PIDSR: Complementary Polarized Image Demosaicing and Super-Resolution

Shuangfan Zhou, Chu Zhou, Youwei Lyu et al.

ICCV 2025arXiv:2508.15650

#12467

Towards a 3D Transfer-based Black-box Attack via Critical Feature Guidance

Shuchao Pang, Zhenghan Chen, Shen Zhang et al.

ICCV 2025arXiv:2504.21847

#12468

Differentiable Room Acoustic Rendering with Multi-View Vision Priors

Derong Jin, Ruohan Gao

NEURIPS 2025spotlightarXiv:2505.20885

#12469

Improved Bounds for Swap Multicalibration and Swap Omniprediction

Haipeng Luo, Spandan Senapati, Vatsal Sharan

NEURIPS 2025arXiv:2507.12837

#12470

Understanding the Evolution of the Neural Tangent Kernel at the Edge of Stability

Kaiqi Jiang, Jeremy Cohen, Yuanzhi Li

NEURIPS 2025spotlightarXiv:2507.16385

#12471

STAR: A Benchmark for Astronomical Star Fields Super-Resolution

WU KUO-CHENG, Guohang Zhuang, Jinyang Huang et al.

NEURIPS 2025arXiv:2410.12974

#12472

BenchmarkCards: Standardized Documentation for Large Language Model Benchmarks

Anna Sokol, Elizabeth Daly, Michael Hind et al.

NEURIPS 2025arXiv:2506.03784

#12473

When Does Closeness in Distribution Imply Representational Similarity? An Identifiability Perspective

Beatrix Nielsen, Emanuele Marconato, Andrea Dittadi et al.

NEURIPS 2025oralarXiv:2505.17610

#12474

Learning Equilibria from Data: Provably Efficient Multi-Agent Imitation Learning

Till Freihaut, Luca Viano, Volkan Cevher et al.

ICCV 2025arXiv:2507.01603

#12475

DepthSync: Diffusion Guidance-Based Depth Synchronization for Scale- and Geometry-Consistent Video Depth Estimation

Yue-Jiang Dong, Wang Zhao, Jiale Xu et al.

NEURIPS 2025arXiv:2505.16732

#12476

Sequential Monte Carlo for Policy Optimization in Continuous POMDPs

Hany Abdulsamad, Sahel Mohammad Iqbal, Simo Sarkka

#12477

Just Dance with pi! A Poly-modal Inductor for Weakly-supervised Video Anomaly Detection

Snehashis Majhi, Giacomo D'Amicantonio, Antitza Dantcheva et al.

CVPR 2025highlight

NEURIPS 2025arXiv:2506.00596

#12478

Seg2Any: Open-set Segmentation-Mask-to-Image Generation with Precise Shape and Semantic Control

Danfeng Li, Hui Zhang, Sheng Wang et al.

NEURIPS 2025arXiv:2510.19314

#12479

Continual Knowledge Adaptation for Reinforcement Learning

Jinwu Hu, ZiHao Lian, Zhiquan Wen et al.

NEURIPS 2025oralarXiv:2509.16950

#12480

Temporal Logic-Based Multi-Vehicle Backdoor Attacks against Offline RL Agents in End-to-end Autonomous Driving

Xuan Chen, Shiwei Feng, Zikang Xiong et al.

NEURIPS 2025arXiv:2508.18850

#12481

ClusterFusion: Expanding Operator Fusion Scope for LLM Inference via Cluster-Level Collective Primitive

Xinhao Luo, Zihan Liu, Yangjie Zhou et al.

CVPR 2025highlightarXiv:2506.09343

#12482

CheckManual: A New Challenge and Benchmark for Manual-based Appliance Manipulation

Yuxing Long, Jiyao Zhang, Mingjie Pan et al.

CVPR 2025arXiv:2411.16801

#12483

Controllable Human Image Generation with Personalized Multi-Garments

Yisol Choi, Sangkyung Kwak, Sihyun Yu et al.

CVPR 2025arXiv:2503.20321

#12484

Recovering Dynamic 3D Sketches from Videos

Jaeah Lee, Changwoon Choi, Young Min Kim et al.

#12485

Point Cloud Upsampling Using Conditional Diffusion Module with Adaptive Noise Suppression

Boqian Zhang, shen yang, Hao Chen et al.

ICCV 2025arXiv:2503.22349

#12486

GCRayDiffusion: Pose-Free Surface Reconstruction via Geometric Consistent Ray Diffusion

Li-Heng Chen, Zi-Xin Zou, Chang Liu et al.

CVPR 2025arXiv:2503.15234

#12487

CoE: Chain-of-Explanation via Automatic Visual Concept Circuit Description and Polysemanticity Quantification

wenlong yu, Qilong Wang, Chuang Liu et al.

CVPR 2025highlightarXiv:2503.17417

#12488

Generative Modeling of Class Probability for Multi-Modal Representation Learning

JungKyoo Shin, Bumsoo Kim, Eunwoo Kim

ICCV 2025arXiv:2503.11633

#12489

Seeing and Seeing Through the Glass: Real and Synthetic Data for Multi-Layer Depth Estimation

Hongyu Wen, Yiming Zuo, Venkat Subramanian et al.

ICCV 2025arXiv:2503.18623

#12490

Training-Free Personalization via Retrieval and Reasoning on Fingerprints

Deepayan Das, Davide Talon, Yiming Wang et al.

CVPR 2025arXiv:2508.02004

#12491

Devil is in the Detail: Towards Injecting Fine Details of Image Prompt in Image Generation via Conflict-free Guidance and Stratified Attention

Kyungmin Jo, Jooyeol Yun, Jaegul Choo

NEURIPS 2025arXiv:2506.04411

#12492

Self-Supervised Contrastive Learning is Approximately Supervised Contrastive Learning

Achleshwar Luthra, Tianbao Yang, Tomer Galanti

NEURIPS 2025oralarXiv:2506.14087

#12493

Multi-Scale Finetuning for Encoder-based Time Series Foundation Models

Zhongzheng Qiao, Chenghao Liu, Yiming Zhang et al.

#12494

DeepCompress-ViT: Rethinking Model Compression to Enhance Efficiency of Vision Transformers at the Edge

Sabbir Ahmed, Abdullah Al Arafat, Deniz Najafi et al.

#12495

Generative Adversarial Diffusion

U-Chae Jun, Jaeeun Ko, Jiwoo Kang

ICCV 2025arXiv:2410.00204

#12496

OpenAnimals: Revisiting Person Re-Identification for Animals Towards Better Generalization

Saihui Hou, Panjian Huang, Zengbin Wang et al.

NEURIPS 2025arXiv:2505.21347

#12497

OVERT: A Benchmark for Over-Refusal Evaluation on Text-to-Image Models

Ziheng Cheng, Yixiao Huang, Hui Xu et al.

NEURIPS 2025arXiv:2502.06398

#12498

Learning Counterfactual Outcomes Under Rank Preservation

Peng Wu, Haoxuan Li, Chunyuan Zheng et al.

#12499

Hybrid-grained Feature Aggregation with Coare-to-fine Language Guidance for Self-supervised Monocular Depth Estimation

Wenyao Zhang, Hongsi Liu, Bohan Li et al.

NEURIPS 2025arXiv:2505.22396

#12500

Zooming from Context to Cue: Hierarchical Preference Optimization for Multi-Image MLLMs

Xudong Li, Mengdan Zhang, Peixian Chen et al.

ICCV 2025highlightarXiv:2507.22824

#12501

Bi-Level Optimization for Self-Supervised AI-Generated Face Detection

Mian Zou, Nan Zhong, Baosheng Yu et al.

NEURIPS 2025arXiv:2505.16234

#12502

LIFEBENCH: Evaluating Length Instruction Following in Large Language Models

Wei Zhang, Zhenhong Zhou, Kun Wang et al.

CVPR 2025arXiv:2406.11643

#12503

CustAny: Customizing Anything from A Single Example

Lingjie Kong, Kai WU, Chengming Xu et al.

CVPR 2025arXiv:2503.21397

#12504

ProHOC: Probabilistic Hierarchical Out-of-Distribution Classification via Multi-Depth Networks

Erik Wallin, Fredrik Kahl, Lars Hammarstrand

ICCV 2025arXiv:2506.23440

#12505

PathDiff: Histopathology Image Synthesis with Unpaired Text and Mask Conditions

Mahesh Bhosale, Abdul Wasi, Yuanhao Zhai et al.

ICCV 2025arXiv:2507.02395

#12506

Continual Multiple Instance Learning with Enhanced Localization for Histopathological Whole Slide Image Analysis

Byung Hyun Lee, Wongi Jeong, Woojae Han et al.

ICCV 2025arXiv:2510.17384

#12507

Closed-Loop Transfer for Weakly-supervised Affordance Grounding

Jiajin Tang, Zhengxuan Wei, Ge Zheng et al.

NEURIPS 2025arXiv:2505.22634

#12508

LabUtopia: High-Fidelity Simulation and Hierarchical Benchmark for Scientific Embodied Agents

Rui Li, Zixuan Hu, Wenxi Qu et al.

NEURIPS 2025arXiv:2505.19582

#12509

Guard Me If You Know Me: Protecting Specific Face-Identity from Deepfakes

Kaiqing Lin, Zhiyuan Yan, Ke-Yue Zhang et al.

NEURIPS 2025arXiv:2506.06277

#12510

ExAct: A Video-Language Benchmark for Expert Action Analysis

Han Yi, Yulu Pan, Feihong He et al.

ICCV 2025arXiv:2507.16337

#12511

One Polyp Identifies All: One-Shot Polyp Segmentation with SAM via Cascaded Priors and Iterative Prompt Evolution

Xinyu Mao, Xiaohan Xing, Fei MENG et al.

ICCV 2025highlightarXiv:2507.21844

#12512

Cross-Architecture Distillation Made Simple with Redundancy Suppression

Weijia Zhang, Yuehao Liu, Wu Ran et al.

NEURIPS 2025arXiv:2506.00838

#12513

Max Entropy Moment Kalman Filter for Polynomial Systems with Arbitrary Noise

Sangli Teng, Harry Zhang, David Jin et al.

ICCV 2025arXiv:2505.24431

#12514

Bridging 3D Anomaly Localization and Repair via High-Quality Continuous Geometric Representation

Bozhong Zheng, Jinye Gan, Xiaohao Xu et al.

NEURIPS 2025arXiv:2310.04606

#12515

Robust Transfer Learning with Unreliable Source Data

Jianqing Fan, Cheng Gao, Jason Klusowski

ICCV 2025arXiv:2509.01250

#12516

Towards More Diverse and Challenging Pre-training for Point Cloud Learning: Self-Supervised Cross Reconstruction with Decoupled Views

Xiangdong Zhang, Shaofeng Zhang, Junchi Yan

CVPR 2025arXiv:2503.23747

#12517

Consistency-aware Self-Training for Iterative-based Stereo Matching

Jingyi Zhou, Peng Ye, Haoyu Zhang et al.

CVPR 2025arXiv:2412.01485

#12518

SerialGen: Personalized Image Generation by First Standardization Then Personalization

Cong Xie, Han Zou, Ruiqi Yu et al.

NEURIPS 2025arXiv:2505.20641

#12519

See through the Dark: Learning Illumination-affined Representations for Nighttime Occupancy Prediction

Yuan Wu, Zhiqiang Yan, Yigong Zhang et al.

NEURIPS 2025arXiv:2509.10696

#12520

Struct-Bench: A Benchmark for Differentially Private Structured Text Generation

Shuaiqi Wang, Vikas Raunak, Arturs Backurs et al.

NEURIPS 2025arXiv:2507.07104

#12521

Vision‑Language‑Vision Auto‑Encoder: Scalable Knowledge Distillation from Diffusion Models

Tiezheng Zhang, Yitong Li, Yu-Cheng Chou et al.

CVPR 2025arXiv:2504.05265

#12522

From Sparse Signal to Smooth Motion: Real-Time Motion Generation with Rolling Prediction Models

German Barquero, Nadine Bertsch, Manojkumar Marramreddy et al.

#12523

Diffusion-based Event Generation for High-Quality Image Deblurring

Xinan Xie, Qing Zhang, Wei-Shi Zheng

NEURIPS 2025arXiv:2505.10947

#12524

Certifying Stability of Reinforcement Learning Policies using Generalized Lyapunov Functions

Kehan Long, Jorge Cortes, Nikolay Atanasov

ICCV 2025arXiv:2408.06079

#12525

Towards Adversarial Robustness via Debiased High-Confidence Logit Alignment

Kejia Zhang, Juanjuan Weng, Zhiming Luo et al.

NEURIPS 2025arXiv:2502.11798

#12526

BackdoorDM: A Comprehensive Benchmark for Backdoor Learning on Diffusion Model

Weilin Lin, Nanjun Zhou, Yanyun Wang et al.

NEURIPS 2025spotlightarXiv:2509.15817

#12527

Escaping saddle points without Lipschitz smoothness: the power of nonlinear preconditioning

Alexander Bodard, Panagiotis Patrinos

CVPR 2025arXiv:2504.21263

#12528

Embracing Collaboration Over Competition: Condensing Multiple Prompts for Visual In-Context Learning

Jinpeng Wang, Tianci Luo, Yaohua Zha et al.

CVPR 2025arXiv:2506.11131

#12529

Segment This Thing: Foveated Tokenization for Efficient Point-Prompted Segmentation

Tanner Schmidt, Richard Newcombe

NEURIPS 2025arXiv:2408.01798

#12530

Differentially Private Gomory-Hu Trees

Anders Aamand, Justin Chen, Mina Dalirrooyfard et al.

CVPR 2025arXiv:2503.19295

#12531

Exploring Semantic Feature Discrimination for Perceptual Image Super-Resolution and Opinion-Unaware No-Reference Image Quality Assessment

Guanglu Dong, Xiangyu Liao, Mingyang Li et al.

NEURIPS 2025arXiv:2510.13660

#12532

OmniGaze: Reward-inspired Generalizable Gaze Estimation in the Wild

Hongyu Qu, Jianan Wei, Xiangbo Shu et al.

ICCV 2025arXiv:2503.06916

#12533

You Are Your Own Best Teacher: Achieving Centralized-level Performance in Federated Learning under Heterogeneous and Long-tailed Data

Shanshan Yan, Zexi Li, Chao Wu et al.

NEURIPS 2025arXiv:2506.15378

#12534

Sampling 3D Molecular Conformers with Diffusion Transformers

J. Thorben Frank, Winfried Ripken, Gregor Lied et al.

NEURIPS 2025arXiv:2510.19307

#12535

Unified Reinforcement and Imitation Learning for Vision-Language Models

Byung-Kwan Lee, Ryo Hachiuma, Yong Man Ro et al.

#12536

FLAVC: Learned Video Compression with Feature Level Attention

Chun Zhang, Heming Sun, Jiro Katto

NEURIPS 2025arXiv:2506.08365

#12537

AlphaFold Database Debiasing for Robust Inverse Folding

Cheng Tan, Zhenxiao Cao, Zhangyang Gao et al.

CVPR 2025arXiv:2504.03800

#12538

Decision SpikeFormer: Spike-Driven Transformer for Decision Making

Wei Huang, Qinying Gu, Nanyang Ye

NEURIPS 2025spotlightarXiv:2505.14547

#12539

GUARD: Constructing Realistic Two-Player Matrix and Security Games for Benchmarking Game-Theoretic Algorithms

Noah Krever, Jakub Cerny, Moise Blanchard et al.

ICCV 2025arXiv:2507.11055

#12540

Alleviating Textual Reliance in Medical Language-guided Segmentation via Prototype-driven Semantic Approximation

Shuchang Ye, Usman Naseem, Mingyuan Meng et al.

ICCV 2025arXiv:2507.20148

#12541

GT-Mean Loss: A Simple Yet Effective Solution for Brightness Mismatch in Low-Light Image Enhancement

Jingxi Liao, Shijie Hao, Richang Hong et al.

#12542

Robust Multi-Object 4D Generation for In-the-wild Videos

Wen-Hsuan Chu, Lei Ke, Jianmeng Liu et al.

NEURIPS 2025arXiv:2505.18752

#12543

Unifying Attention Heads and Task Vectors via Hidden State Geometry in In-Context Learning

Haolin Yang, Hakaze Cho, Yiqiao Zhong et al.

ICCV 2025arXiv:2411.17845

#12544

CABLD: Contrast-Agnostic Brain Landmark Detection with Consistency-Based Regularization

Soorena Salari, Arash Harirpoush, Hassan Rivaz et al.

NEURIPS 2025arXiv:2508.13632

#12545

OmniTry: Virtual Try-On Anything without Masks

Yutong Feng, Linlin Zhang, Hengyuan Cao et al.

CVPR 2025arXiv:2503.13693

#12546

Adapting to the Unknown: Training-Free Audio-Visual Event Perception with Dynamic Thresholds

Eitan Shaar, Ariel Shaulov, Gal Chechik et al.

NEURIPS 2025arXiv:2505.15636

#12547

Distance Adaptive Beam Search for Provably Accurate Graph-Based Nearest Neighbor Search

Yousef Al-Jazzazi, Haya Diwan, Jinrui Gou et al.

NEURIPS 2025arXiv:2501.06807

#12548

MPCache: MPC-Friendly KV Cache Eviction for Efficient Private LLM Inference

Wenxuan Zeng, Ye Dong, Jinjin Zhou et al.

NEURIPS 2025arXiv:2505.11152

#12549

Learning Dense Hand Contact Estimation from Imbalanced Data

Daniel Jung, Kyoung Mu Lee

NEURIPS 2025arXiv:2510.00983

#12550

Riemannian Consistency Model

Chaoran Cheng, Yusong Wang, Yuxin Chen et al.

#12551

Dual-Granularity Semantic Guided Sparse Routing Diffusion Model for General Pansharpening

Yinghui Xing, Qu Li Tao, Shizhou Zhang et al.

ICCV 2025arXiv:2510.27263

#12552

ODP-Bench: Benchmarking Out-of-Distribution Performance Prediction

Han Yu, Kehan Li, Dongbai Li et al.

ICCV 2025arXiv:2508.09811

#12553

TRACE: Learning 3D Gaussian Physical Dynamics from Multi-view Videos

Jinxi Li, Ziyang Song, Bo Yang

#12554

BLADE: Single-view Body Mesh Estimation through Accurate Depth Estimation

Shengze Wang, Jiefeng Li, Tianye Li et al.

CVPR 2025highlightarXiv:2412.02690

#12555

FoundHand: Large-Scale Domain-Specific Learning for Controllable Hand Image Generation

Kefan Chen, Chaerin Min, Linguang Zhang et al.

NEURIPS 2025arXiv:2501.06382

#12556

Dynamics of Spontaneous Topic Changes in Next Token Prediction with Self-Attention

Mumin Jia, Jairo Diaz-Rodriguez

NEURIPS 2025arXiv:2510.22667

#12557

Block Coordinate Descent for Neural Networks Provably Finds Global Minima

Shunta Akiyama

ICCV 2025arXiv:2503.07235

#12558

Retinex-MEF: Retinex-based Glare Effects Aware Unsupervised Multi-Exposure Image Fusion

Haowen Bai, Jiangshe Zhang, Zixiang Zhao et al.

#12559

Rethinking Correspondence-based Category-Level Object Pose Estimation

Huan Ren, Wenfei Yang, Shifeng Zhang et al.

NEURIPS 2025arXiv:2505.13904

#12560

Learning to Insert for Constructive Neural Vehicle Routing Solver

Fu Luo, Xi Lin, Mengyuan Zhong et al.

CVPR 2025arXiv:2411.16154

#12561

DeDe: Detecting Backdoor Samples for SSL Encoders via Decoders

Sizai Hou, Songze Li, Duanyi Yao

ICCV 2025arXiv:2507.09524

#12562

When Schrödinger Bridge Meets Real-World Image Dehazing with Unpaired Training

Yunwei Lan, Zhigao Cui, Xin Luo et al.

NEURIPS 2025arXiv:2412.03906

#12563

Final-Model-Only Data Attribution with a Unifying View of Gradient-Based Methods

Dennis Wei, Inkit Padhi, Soumya Ghosh et al.

CVPR 2025arXiv:2405.00794

#12564

Coherent 3D Portrait Video Reconstruction via Triplane Fusion

Shengze Wang, Xueting Li, Chao Liu et al.

NEURIPS 2025arXiv:2506.10980

#12565

InstaInpaint: Instant 3D-Scene Inpainting with Masked Large Reconstruction Model

Junqi You, Chieh Lin, Weijie Lyu et al.

ICCV 2025arXiv:2507.08979

#12566

PRISM: Reducing Spurious Implicit Biases in Vision-Language Models with LLM-Guided Embedding Projection

Mahdiyar Molahasani, Azadeh Motamedi, Michael Greenspan et al.

CVPR 2025highlightarXiv:2503.00605

#12567

GenVDM: Generating Vector Displacement Maps From a Single Image

Yuezhi Yang, Qimin Chen, Vladimir G. Kim et al.

#12568

TexGarment: Consistent Garment UV Texture Generation via Efficient 3D Structure-Guided Diffusion Transformer

Jialun Liu, Jinbo Wu, Xiaobo Gao et al.

ICCV 2025arXiv:2412.08619

#12569

Physics Context Builders: A Modular Framework for Physical Reasoning in Vision-Language Models

Vahid Balazadeh, Mohammadmehdi Ataei, Hyunmin Cheong et al.

#12570

Insightful Instance Features for 3D Instance Segmentation

Wonseok Roh, Hwanhee Jung, Giljoo Nam et al.

NEURIPS 2025arXiv:2501.18363

#12571

Exploring the Noise Robustness of Online Conformal Prediction

HuaJun Xi, Kangdao Liu, Hao Zeng et al.

NEURIPS 2025arXiv:2509.17276

#12572

Probabilistic Token Alignment for Large Language Model Fusion

Runjia Zeng, James Liang, Cheng Han et al.

NEURIPS 2025arXiv:2510.12157

#12573

Self-Verifying Reflection Helps Transformers with CoT Reasoning

Zhongwei Yu, Wannian Xia, Xue Yan et al.

CVPR 2025arXiv:2503.05283

#12574

Escaping Plato's Cave: Towards the Alignment of 3D and Text Latent Spaces

Souhail Hadgi, Luca Moschella, Andrea Santilli et al.

NEURIPS 2025arXiv:2503.01544

#12575

Compositional Reasoning with Transformers, RNNs, and Chain of Thought

Gilad Yehudai, Noah Amsel, Joan Bruna

NEURIPS 2025arXiv:2503.09790

#12576

Constrained Discrete Diffusion

Michael Cardei, Jacob K Christopher, Bhavya Kailkhura et al.

NEURIPS 2025arXiv:2503.09617

#12577

Factorio Learning Environment

Jack Hopkins, Mart Bakler, Akbir Khan

CVPR 2025highlightarXiv:2504.05576

#12578

SoundVista: Novel-View Ambient Sound Synthesis via Visual-Acoustic Binding

Mingfei Chen, Israel D. Gebru, Ishwarya Ananthabhotla et al.

#12579

Generative Map Priors for Collaborative BEV Semantic Segmentation

Jiahui Fu, Yue Gong, Luting Wang et al.

NEURIPS 2025arXiv:2410.21151

#12580

BraVE: Offline Reinforcement Learning for Discrete Combinatorial Action Spaces

Matthew Landers, Taylor W. Killian, Hugo Barnes et al.

NEURIPS 2025arXiv:2407.04884

#12581

Convex Approximation of Two-Layer ReLU Networks for Hidden State Differential Privacy

Rob Romijnders, Antti Koskela

NEURIPS 2025spotlightarXiv:2505.12553

#12582

Hamiltonian Descent Algorithms for Optimization: Accelerated Rates via Randomized Integration Time

Qiang Fu, Andre Wibisono

NEURIPS 2025arXiv:2509.25638

#12583

Generalized Contrastive Learning for Universal Multimodal Retrieval

Jungsoo Lee, Janghoon Cho, Hyojin Park et al.

NEURIPS 2025arXiv:2504.10804

#12584

Harnessing the Computation Redundancy in ViTs to Boost Adversarial Transferability

Jiani Liu, Zhiyuan Wang, Zeliang Zhang et al.

NEURIPS 2025arXiv:2505.18832

#12585

Localizing Knowledge in Diffusion Transformers

Arman Zarei, Samyadeep Basu, Keivan Rezaei et al.

NEURIPS 2025arXiv:2505.23049

#12586

DenoiseRotator: Enhance Pruning Robustness for LLMs via Importance Concentration

Tianteng Gu, Bei Liu, Bo Xiao et al.

NEURIPS 2025spotlightarXiv:2412.02857

#12587

Measuring Fingerprints of Web-filtered Text Datasets and Fingerprint Propagation Through Training

Youssef Mansour, Reinhard Heckel

ICCV 2025arXiv:2506.15864

#12588

Improving Rectified Flow with Boundary Conditions

Xixi Hu, Runlong Liao, Bo Liu et al.

NEURIPS 2025oralarXiv:2505.17103

#12589

Forging Time Series with Language: A Large Language Model Approach to Synthetic Data Generation

Cécile Rousseau, Tobia Boschi, Giandomenico Cornacchia et al.

ICCV 2025arXiv:2311.18564

#12590

Leveraging Local Patch Alignment to Seam-cutting for Large Parallax Image Stitching

Tianli Liao, Chenyang Zhao, Lei Li et al.

NEURIPS 2025arXiv:2503.18853

#12591

3DOT: Texture Transfer for 3DGS Objects from a Single Reference Image

Xiao Cao, Beibei Lin, Bo Wang et al.

ICCV 2025arXiv:2507.13599

#12592

Learning Deblurring Texture Prior from Unpaired Data with Diffusion Model

Chengxu Liu, Lu Qi, Jinshan Pan et al.

NEURIPS 2025arXiv:2505.21962

#12593

A2Seek: Towards Reasoning-Centric Benchmark for Aerial Anomaly Understanding

Mengjingcheng Mo, Xinyang Tong, Mingpi Tan et al.

NEURIPS 2025arXiv:2507.16814

#12594

Semi-off-Policy Reinforcement Learning for Vision-Language Slow-Thinking Reasoning

Junhao Shen, Haiteng Zhao, Yuzhe Gu et al.

#12595

Backdoor Attacks on Neural Networks via One-Bit Flip

Xiang Li, Lannan Luo, Qiang Zeng

NEURIPS 2025arXiv:2507.12646

#12596

Reconstruct, Inpaint, Test-Time Finetune: Dynamic Novel-view Synthesis from Monocular Videos

Kaihua Chen, Tarasha Khurana, Deva Ramanan

NEURIPS 2025arXiv:2506.19072

#12597

Hawaii: Hierarchical Visual Knowledge Transfer for Efficient Vision-Language Models

Yimu Wang, Mozhgan Nasr Azadani, Sean Sedwards et al.

NEURIPS 2025arXiv:2404.11577

#12598

A Reliable Cryptographic Framework for Empirical Machine Unlearning Evaluation

Yiwen Tu, Pingbang Hu, Jiaqi Ma

ICCV 2025arXiv:2507.09446

#12599

Efficient Multi-Person Motion Prediction by Lightweight Spatial and Temporal Interactions

Yuanhong Zheng, Ruixuan Yu, Jian Sun

NEURIPS 2025arXiv:2507.07694

#12600

SAS: Simulated Attention Score

Chuanyang Zheng, Jiankai Sun, Yihang Gao et al.