Most Cited 2025 &quot;robust model distillation&quot; Papers

#20406

MODA: Motion-Drift Augmentation for Inertial Human Motion Analysis

Yinghao Wu, Shihui Guo, Yipeng Qin

#20407

Learning to Filter Outlier Edges in Global SfM

Nicole Damblon, Marc Pollefeys, Daniel Barath

#20408

PhysPDE: Rethinking PDE Discovery and a Physical HYpothesis Selection Benchmark

Mingquan Feng, Yixin Huang, Yizhou Liu et al.

ICLR 2025poster

#20409

Improving the Training of Data-Efficient GANs via Quality Aware Dynamic Discriminator Rejection Sampling

Zhaoyu Zhang, Yang Hua, Guanxiong Sun et al.

CVPR 2025highlightarXiv:2412.01256

#20410

NLPrompt: Noise-Label Prompt Learning for Vision-Language Models

Bikang Pan, Qun Li, Xiaoying Tang et al.

#20411

No Pains, More Gains: Recycling Sub-Salient Patches for Efficient High-Resolution Image Recognition

Rong Qin, Xin Liu, Xingyu Liu et al.

ICLR 2025posterarXiv:2311.05589

#20412

A Coefficient Makes SVRG Effective

Yida Yin, Zhiqiu Xu, Zhiyuan Li et al.

#20413

nGPT: Normalized Transformer with Representation Learning on the Hypersphere

Ilya Loshchilov, Cheng-Ping Hsieh, Simeng Sun et al.

ICLR 2025posterarXiv:2410.01131

#20414

Where's the Liability in the Generative Era? Recovery-based Black-Box Detection of AI-Generated Content

Haoyue Bai, Yiyou Sun, Wei Cheng et al.

CVPR 2025posterarXiv:2505.01008

#20415

Understanding Warmup-Stable-Decay Learning Rates: A River Valley Loss Landscape View

Kaiyue Wen, Zhiyuan Li, Jason Wang et al.

ICLR 2025poster

#20416

Koala-36M: A Large-scale Video Dataset Improving Consistency between Fine-grained Conditions and Video Content

Qiuheng Wang, Yukai Shi, Jiarong Ou et al.

CVPR 2025posterarXiv:2410.08260

#20417

VASparse: Towards Efficient Visual Hallucination Mitigation via Visual-Aware Token Sparsification

Xianwei Zhuang, Zhihong Zhu, Yuxin Xie et al.

CVPR 2025posterarXiv:2501.06553

#20418

Elucidating the Preconditioning in Consistency Distillation

Kaiwen Zheng, Guande He, Jianfei Chen et al.

ICLR 2025posterarXiv:2502.02922

#20419

Dual-Interrelated Diffusion Model for Few-Shot Anomaly Image Generation

Ying Jin, Jinlong Peng, Qingdong He et al.

CVPR 2025posterarXiv:2408.13509

#20420

Beyond Worst-Case Dimensionality Reduction for Sparse Vectors

Sandeep Silwal, David Woodruff, Qiuyi (Richard) Zhang

ICLR 2025posterarXiv:2502.19865

#20421

Towards a Geometric Understanding of Tensor Learning via the t-Product

Andong Wang, Yuning Qiu, Haonan Huang et al.

ICLR 2025posterarXiv:2405.15885

#20422

Diffusion Bridge Implicit Models

Kaiwen Zheng, Guande He, Jianfei Chen et al.

#20423

Decoupled Subgraph Federated Learning

Javad Aliakbari, Johan Östman, Alexandre Graell i Amat

ICLR 2025posterarXiv:2402.19163

#20424

CoMatcher: Multi-View Collaborative Feature Matching

Jintao Zhang, Zimin Xia, Mingyue Dong et al.

CVPR 2025posterarXiv:2504.01872

#20425

Repurposing in AI: A Distinct Approach or an Extension of Creative Problem Solving?

Aissatou Diallo, Antonis Bikakis, Luke Dickens et al.

ICLR 2025poster

#20426

Motif-aware Graph Neural Networks for Networked Time Series Imputation

Nourhan Ahmed, Vijaya Krishna Yalavarthi, Lars Schmidt-Thieme

AAAI 2025paper

#20427

PillarHist: A Quantization-aware Pillar Feature Encoder based on Height-aware Histogram

Sifan Zhou, Zhihang Yuan, Dawei Yang et al.

AAAI 2025paperarXiv:2412.18571

#20428

SparseMVC: Probing Cross-view Sparsity Variations for Multi-view Clustering

Ruimeng Liu, Xin Zou, Chang Tang et al.

NEURIPS 2025spotlight

#20429

Scalable Quantum-Inspired Optimization Through Dynamic Qubit Compression

Co Tran, Quoc-Bao Tran, Hy Truong Son et al.

#20430

Towards Explicit Geometry-Reflectance Collaboration for Generalized LiDAR Segmentation in Adverse Weather

Longyu Yang, Ping Hu, Shangbo Yuan et al.

CVPR 2025posterarXiv:2506.02396

#20431

Contextual Self-paced Learning for Weakly Supervised Spatio-Temporal Video Grounding

Akash Kumar, Zsolt Kira, Yogesh S Rawat

ICLR 2025oralarXiv:2501.17053

#20432

Generalizable Object Keypoint Localization from Generative Priors

Dongkai Wang, Jiang Duan, Liangjian Wen et al.

ICCV 2025posterarXiv:2508.08165

#20433

Integrating Task-Specific and Universal Adapters for Pre-Trained Model-based Class-Incremental Learning

yan wang, Da-Wei Zhou, Han-Jia Ye

#20434

From an LLM Swarm to a PDDL-empowered Hive: Planning Self-executed Instructions in a Multi-modal Jungle

Kaustubh Vyas, Damien Graux, Yijun Yang et al.

ICLR 2025posterarXiv:2412.12839

#20435

Port-Hamiltonian Architectural Bias for Long-Range Propagation in Deep Graph Networks

Simon Heilig, Alessio Gravina, Alessandro Trenta et al.

ICLR 2025posterarXiv:2405.17163

#20436

Chebyshev Attention Depth Permutation Texture Network with Latent Texture Attribute Loss

Ravishankar Evani, Deepu Rajan, Shangbo Mao

ICLR 2025posterarXiv:2501.15510

#20437

Universal Image Restoration Pre-training via Degradation Classification

Jiakui Hu, Lujia Jin, Zhengjian Yao et al.

#20438

Shining Yourself: High-Fidelity Ornaments Virtual Try-on with Diffusion Model

Yingmao Miao, Zhanpeng Huang, Rui Han et al.

CVPR 2025posterarXiv:2503.16065

#20439

AnomalyCoT: A Multi-Scenario Chain-of-Thought Dataset for Multimodal Large Language Models

Jiaxi Cheng, Yuliang Xu, Shoupeng Wang et al.

CVPR 2025posterarXiv:2411.17786

#20440

DreamCache: Finetuning-Free Lightweight Personalized Image Generation via Feature Caching

Emanuele Aiello, Umberto Michieli, Diego Valsesia et al.

#20441

Rethinking Evaluation of Infrared Small Target Detection

Youwei Pang, Xiaoqi Zhao, Lihe Zhang et al.

NEURIPS 2025posterarXiv:2509.16888

#20442

Linguistics-aware Masked Image Modeling for Self-supervised Scene Text Recognition

Yifei Zhang, Chang Liu, Jin Wei et al.

CVPR 2025posterarXiv:2503.18746

#20443

EIDT-V: Exploiting Intersections in Diffusion Trajectories for Model-Agnostic, Zero-Shot, Training-Free Text-to-Video Generation

Diljeet Jagpal, Xi Chen, Vinay P. Namboodiri

CVPR 2025posterarXiv:2504.06861

#20444

GenSpace: Benchmarking Spatially-Aware Image Generation

Zehan Wang, Jiayang Xu, Ziang Zhang et al.

NEURIPS 2025posterarXiv:2505.24870

#20445

ReWind: Understanding Long Videos with Instructed Learnable Memory

Anxhelo Diko, Tinghuai Wang, Wassim Swaileh et al.

CVPR 2025posterarXiv:2411.15556

#20446

ABBSPO: Adaptive Bounding Box Scaling and Symmetric Prior based Orientation Prediction for Detecting Aerial Image Objects

Woojin Lee, Hyugjae Chang, Jaeho Moon et al.

CVPR 2025posterarXiv:2512.10031

#20447

Semantic-guided Cross-Modal Prompt Learning for Skeleton-based Zero-shot Action Recognition

Anqi Zhu, Jingmin Zhu, James Bailey et al.

NEURIPS 2025posterarXiv:2505.21177

#20448

SolidGeo: Measuring Multimodal Spatial Math Reasoning in Solid Geometry

Peijie Wang, Chao Yang, Zhong-Zhi Li et al.

#20449

DISCO: DISCrete nOise for Conditional Control in Text-to-Image Diffusion Models

Longquan Dai, Wu Ming, Dejiao Xue et al.

ICLR 2025posterarXiv:2503.10689

#20450

Learning to Contextualize Web Pages for Enhanced Decision Making by LLM Agents

Dongjun Lee, Juyong Lee, Kyuyoung Kim et al.

#20451

VidHalluc: Evaluating Temporal Hallucinations in Multimodal Large Language Models for Video Understanding

Chaoyu Li, Eun Woo Im, Pooyan Fazli

CVPR 2025posterarXiv:2412.03735

#20452

CrypticBio: A Large Multimodal Dataset for Visually Confusing Species

Georgiana Manolache, Gerard Schouten, Joaquin Vanschoren

NEURIPS 2025oral

#20453

Reasoning is Periodicity? Improving Large Language Models Through Effective Periodicity Modeling

Yihong Dong, Ge Li, Xue Jiang et al.

NEURIPS 2025posterarXiv:2502.21309

#20454

All-directional Disparity Estimation for Real-world QPD Images

Hongtao Yu, Shaohui Song, Lihu Sun et al.

#20455

Unifying Reconstruction and Density Estimation via Invertible Contraction Mapping in One-Class Classification

Xiaolei Wang, Tianhong Dai, Huihui Bai et al.

CVPR 2025posterarXiv:2412.17684

#20456

COBRA: COmBinatorial Retrieval Augmentation for Few-Shot Adaptation

Arnav Mohanty Das, Gantavya Bhatt, Lilly Kumari et al.

#20457

MFogHub: Bridging Multi-Regional and Multi-Satellite Data for Global Marine Fog Detection and Forecasting

Mengqiu XU, Kaixin Chen, Heng Guo et al.

CVPR 2025posterarXiv:2505.10281

#20458

Dual Consolidation for Pre-Trained Model-Based Domain-Incremental Learning

Da-Wei Zhou, Zi-Wen Cai, Han-Jia Ye et al.

CVPR 2025posterarXiv:2410.00911

#20459

Efficient Test-time Adaptive Object Detection via Sensitivity-Guided Pruning

Kunyu Wang, Xueyang Fu, Xin Lu et al.

CVPR 2025posterarXiv:2506.02462

#20460

TEMPO: Temporal Multi-scale Autoregressive Generation of Protein Conformational Ensembles

Yaoyao Xu, Di Wang, Zihan Zhou et al.

NEURIPS 2025oralarXiv:2511.05510

#20461

Alignment, Mining and Fusion: Representation Alignment with Hard Negative Mining and Selective Knowledge Fusion for Medical Visual Question Answering

Yuanhao Zou, Zhaozheng Yin

CVPR 2025posterarXiv:2510.08791

#20462

Q-Bench-Video: Benchmark the Video Quality Understanding of LMMs

Zicheng Zhang, Ziheng Jia, Haoning Wu et al.

CVPR 2025posterarXiv:2409.20063

#20463

STAIR: Addressing Stage Misalignment through Temporal-Aligned Preference Reinforcement Learning

Yao Luan, Ni Mu, Yiqin Yang et al.

NEURIPS 2025oralarXiv:2509.23802

#20464

MAD: Memory-Augmented Detection of 3D Objects

Ben Agro, Sergio Casas, Patrick Wang et al.

NEURIPS 2025posterarXiv:2502.06597

#20465

Continual Release Moment Estimation with Differential Privacy

Nikita Kalinin, Jalaj Upadhyay, Christoph Lampert

#20466

Training-free Neural Architecture Search through Variance of Knowledge of Deep Network Weights

Ondrej Tybl, Lukas Neumann

#20467

RAEncoder: A Label-Free Reversible Adversarial Examples Encoder for Dataset Intellectual Property Protection

Fan Xing, Zhuo Tian, Xuefeng Fan et al.

NEURIPS 2025oralarXiv:2506.01031

#20468

NavBench: Probing Multimodal Large Language Models for Embodied Navigation

Yanyuan Qiao, Haodong Hong, Wenqi Lyu et al.

#20469

Towards Fine-Grained Interpretability: Counterfactual Explanations for Misclassification with Saliency Partition

ZHANG LINTONG, Kang Yin, Seong-Whan Lee

CVPR 2025posterarXiv:2511.07974

#20470

Not Just Text: Uncovering Vision Modality Typographic Threats in Image Generation Models

Hao Cheng, Erjia Xiao, Jiayan Yang et al.

CVPR 2025posterarXiv:2412.05538

#20471

Generation as Search Operator for Test-Time Scaling of Diffusion-based Combinatorial Optimization

Yang Li, Lvda Chen, Haonan Wang et al.

#20472

Mamba-Reg: Vision Mamba Also Needs Registers

Feng Wang, Jiahao Wang, Sucheng Ren et al.

CVPR 2025posterarXiv:2503.22952

#20473

OmniMMI: A Comprehensive Multi-modal Interaction Benchmark in Streaming Video Contexts

Yuxuan Wang, Yueqian Wang, Bo Chen et al.

#20474

When Semantics Mislead Vision: Mitigating Large Multimodal Models Hallucinations in Scene Text Spotting and Understanding

Yan Shu, Hangui Lin, Yexin Liu et al.

NEURIPS 2025posterarXiv:2506.05551

#20475

Imputation-free and Alignment-free: Incomplete Multi-view Clustering Driven by Consensus Semantic Learning

yuzhuo dai, Jiaqi Jin, Zhibin Dong et al.

CVPR 2025posterarXiv:2505.11182

#20476

Accelerating Block Coordinate Descent for LLM Finetuning via Landscape Expansion

Qijun Luo, Yifei Shen, Liangzu Peng et al.

#20477

Autoregressive Sequential Pretraining for Visual Tracking

Shiyi Liang, Yifan Bai, Yihong Gong et al.

CVPR 2025posterarXiv:2411.10332

#20478

Number it: Temporal Grounding Videos like Flipping Manga

Yongliang Wu, Xinting Hu, Yuyang Sun et al.

#20479

HermesFlow: Seamlessly Closing the Gap in Multimodal Understanding and Generation

Ling Yang, Xinchen Zhang, Ye Tian et al.

NEURIPS 2025posterarXiv:2502.12148

#20480

OpenOmni: Advancing Open-Source Omnimodal Large Language Models with Progressive Multimodal Alignment and Real-time Emotional Speech Synthesis

Run Luo, Ting-En Lin, Haonan Zhang et al.

NEURIPS 2025posterarXiv:2506.03750

#20481

MoodAngels: A Retrieval-augmented Multi-agent Framework for Psychiatry Diagnosis

Mengxi Xiao, Ben Liu, He Li et al.

#20482

A Regularized Newton Method for Nonconvex Optimization with Global and Local Complexity Guarantees

Yuhao Zhou, Jintao Xu, Bingrui Li et al.

NEURIPS 2025posterarXiv:2502.04799

#20483

Uncertainty Meets Diversity: A Comprehensive Active Learning Framework for Indoor 3D Object Detection

Jiangyi Wang, Na Zhao

CVPR 2025posterarXiv:2503.16125

#20484

Interaction-Centric Knowledge Infusion and Transfer for Open Vocabulary Scene Graph Generation

Lin Li, Chuhan ZHANG, Dong Zhang et al.

NEURIPS 2025posterarXiv:2511.05935

#20485

CVGL: Causal Learning and Geometric Topology

Songsong Ouyang, Yingying Zhu

CVPR 2025posterarXiv:2504.21435

#20486

SeriesBench: A Benchmark for Narrative-Driven Drama Series Understanding

chenkai zhang, Yiming Lei, Zeming Liu et al.

#20487

GS-2DGS: Geometrically Supervised 2DGS for Reflective Object Reconstruction

Jinguang Tong, Xuesong li, Fahira Afzal Maken et al.

CVPR 2025posterarXiv:2506.13110

#20488

PC-Net: Weakly Supervised Compositional Moment Retrieval via Proposal-Centric Network

Mingyao Zhou, Hao Sun, Wei Xie et al.

NEURIPS 2025oral

#20489

PanSplat: 4K Panorama Synthesis with Feed-Forward Gaussian Splatting

Cheng Zhang, Haofei Xu, Qianyi Wu et al.

CVPR 2025posterarXiv:2412.12096

#20490

GTR-Loc: Geospatial Text Regularization Assisted Outdoor LiDAR Localization

Shangshu Yu, Wen Li, Xiaotian Sun et al.

CVPR 2025posterarXiv:2412.14456

#20491

LEDiff: Latent Exposure Diffusion for HDR Generation

Chao Wang, Zhihao Xia, Thomas Leimkuehler et al.

#20492

Flattening Hierarchies with Policy Bootstrapping

John Zhou, Jonathan Kao

NEURIPS 2025spotlightarXiv:2505.14975

#20493

Unleashing the Power of One-Step Diffusion based Image Super-Resolution via a Large-Scale Diffusion Discriminator

Jianze Li, Jiezhang Cao, Zichen Zou et al.

NEURIPS 2025posterarXiv:2410.04224

#20494

FloVD: Optical Flow Meets Video Diffusion Model for Enhanced Camera-Controlled Video Synthesis

Wonjoon Jin, Qi Dai, Chong Luo et al.

CVPR 2025posterarXiv:2502.08244

#20495

LithoSim: A Large, Holistic Lithography Simulation Benchmark for AI-Driven Semiconductor Manufacturing

Hongquan He, Zhen Wang, Jingya Wang et al.

NEURIPS 2025posterarXiv:2510.20602

#20496

Resounding Acoustic Fields with Reciprocity

Zitong Lan, Yiduo Hao, Mingmin Zhao

#20497

NVILA: Efficient Frontier Visual Language Models

Zhijian Liu, Ligeng Zhu, Baifeng Shi et al.

CVPR 2025posterarXiv:2412.04468

#20498

Fuzzy Multimodal Learning for Trusted Cross-modal Retrieval

Siyuan Duan, Yuan Sun, Dezhong Peng et al.

CVPR 2025posterarXiv:2412.02684

#20499

AniGS: Animatable Gaussian Avatar from a Single Image with Inconsistent Gaussian Reconstruction

Lingteng Qiu, Shenhao Zhu, Qi Zuo et al.

#20500

Steering Information Utility in Key-Value Memory for Language Model Post-Training

Chunyuan Deng, Ruidi Chang, Hanjie Chen

NEURIPS 2025posterarXiv:2507.05158

#20501

Analog Foundation Models

Julian Büchel, Iason Chalas, Giovanni Acampa et al.

NEURIPS 2025posterarXiv:2505.09663

#20502

UniMRSeg: Unified Modality-Relax Segmentation via Hierarchical Self-Supervised Compensation

Xiaoqi Zhao, Youwei Pang, Chenyang Yu et al.

NEURIPS 2025posterarXiv:2509.16170

#20503

NTKMTL: Mitigating Task Imbalance in Multi-Task Learning from Neural Tangent Kernel Perspective

Xiaohan Qin, Xiaoxing Wang, Ning Liao et al.

NEURIPS 2025posterarXiv:2510.18258

#20504

Can LLMs Correct Themselves? A Benchmark of Self-Correction in LLMs

Guiyao Tie, Zenghui Yuan, Zeli Zhao et al.

NEURIPS 2025posterarXiv:2510.16062

#20505

Causal Discovery and Inference through Next-Token Prediction

Eivinas Butkus, Nikolaus Kriegeskorte

#20506

Simultaneous Statistical Inference for Off-Policy Evaluation in Reinforcement Learning

Tianpai Luo, Xinyuan Fan, Weichi Wu

#20507

Seeing More with Less: Human-like Representations in Vision Models

Andrey Gizdov, Shimon Ullman, Daniel Harari

NEURIPS 2025posterarXiv:2506.07104

#20508

How Far Are We from Optimal Reasoning Efficiency?

Jiaxuan Gao, Shu Yan, Qixin Tan et al.

#20509

A Unified Reasoning Framework for Holistic Zero-Shot Video Anomaly Analysis

Dongheng Lin, Mengxue Qu, Kunyang Han et al.

NEURIPS 2025oralarXiv:2511.00962

#20510

EF-3DGS: Event-Aided Free-Trajectory 3D Gaussian Splatting

Bohao Liao, Wei Zhai, Zengyu Wan et al.

NEURIPS 2025oralarXiv:2410.15392

#20511

HPSERec: A Hierarchical Partitioning and Stepwise Enhancement Framework for Long-tailed Sequential Recommendation

Xiaolong Xu, Xudong Zhao, Haolong Xiang et al.

NEURIPS 2025posterarXiv:2508.05164

#20512

S$^2$M-Former: Spiking Symmetric Mixing Branchformer for Brain Auditory Attention Detection

Jiaqi Wang, Zhengyu Ma, Xiongri Shen et al.

#20513

Disentangling Safe and Unsafe Image Corruptions via Anisotropy and Locality

Ramchandran Muthukumar, Ambar Pal, Jeremias Sulam et al.

NEURIPS 2025posterarXiv:2505.23868

#20514

Noise-Robustness Through Noise: A Framework combining Asymmetric LoRA with Poisoning MoE

Zhaokun Wang, Jinyu Guo, Jingwen Pu et al.

#20515

Sample-Conditional Coverage in Split-Conformal Prediction

John Duchi

CVPR 2025posterarXiv:2412.09754

#20516

ViCaS: A Dataset for Combining Holistic and Pixel-level Video Understanding using Captions with Grounded Segmentation

Ali Athar, Xueqing Deng, Liang-Chieh Chen

#20517

IRIS: Inverse Rendering of Indoor Scenes from Low Dynamic Range Images

Chih-Hao Lin, Jia-Bin Huang, Zhengqin Li et al.

CVPR 2025posterarXiv:2401.12977

#20518

World Models Should Prioritize the Unification of Physical and Social Dynamics

Xiaoyuan Zhang, Chengdong Ma, Yizhe Huang et al.

NEURIPS 2025posterarXiv:2510.21219

#20519

Can Machines Understand Composition? Dataset and Benchmark for Photographic Image Composition Embedding and Understanding

Zhaoran Zhao, Peng Lu, Anran Zhang et al.

NEURIPS 2025oralarXiv:2510.00075

#20520

NeurIPS should lead scientific consensus on AI policy

Rishi Bommasani

#20521

Dense-SfM: Structure from Motion with Dense Consistent Matching

JongMin Lee, Sungjoo Yoo

CVPR 2025posterarXiv:2501.14277

#20522

Foundation Models for Scientific Discovery: From Paradigm Enhancement to Paradigm Transition

Fan LIU, Jindong Han, Tengfei Lyu et al.

NEURIPS 2025posterarXiv:2510.15280

#20523

Let's Chorus: Partner-aware Hybrid Song-Driven 3D Head Animation

Xiumei Xie, Zikai Huang, Wenhao Xu et al.

CVPR 2025posterarXiv:2411.12592

#20524

SPARS3R: Semantic Prior Alignment and Regularization for Sparse 3D Reconstruction

Yutao Tang, Yuxiang Guo, Deming Li et al.

#20525

Factored-NeuS: Reconstructing Surfaces, Illumination, and Materials of Possibly Glossy Objects

Yue Fan, Ningjing Fan, Ivan Skorokhodov et al.

CVPR 2025posterarXiv:2305.17929

#20526

ICLScan: Detecting Backdoors in Black-Box Large Language Models via Targeted In-context Illumination

Xiaoyi Pang, Xuanyi Hao, Song Guo et al.

CVPR 2025posterarXiv:2501.03006

#20527

TransPixeler: Advancing Text-to-Video Generation with Transparency

Luozhou Wang, Yijun Li, ZhiFei Chen et al.

#20528

On the Stability and Generalization of Meta-Learning: the Impact of Inner-Levels

Wenjun Ding, Jingling Liu, Lixing Chen et al.

NEURIPS 2025posterarXiv:2306.03530

#20529

RLtools: A Fast, Portable Deep Reinforcement Learning Library for Continuous Control

Jonas Eschmann, Dario Albani, Giuseppe Loianno

#20530

FlashGS: Efficient 3D Gaussian Splatting for Large-scale and High-resolution Rendering

Guofeng Feng, Siyan Chen, Rong Fu et al.

CVPR 2025posterarXiv:2408.07967

#20531

PaceLLM: Brain-Inspired Large Language Models for Long-Context Understanding

Kangcong Li, Peng Ye, Chongjun Tu et al.

NEURIPS 2025posterarXiv:2506.17310

#20532

Geometric Learning with Positively Decomposable Kernels

Nathael Da Costa, Cyrus Mostajeran, Juan-Pablo Ortega et al.

NEURIPS 2025posterarXiv:2310.13821

#20533

Constrained Linear Thompson Sampling

Aditya Gangrade, Venkatesh Saligrama

NEURIPS 2025posterarXiv:2503.02043

#20534

Versatile differentially private learning for general loss functions

Qilong Lu, Songxi Chen, Yumou Qiu

NEURIPS 2025posterarXiv:2501.15127

#20535

Statistical Inference for Decentralized Federated Learning

Jia Gu, Songxi Chen

#20536

LoSplit: Loss-Guided Dynamic Split for Training-Time Defense Against Graph Backdoor Attacks

Di Jin, Yuxiang Zhang, Bingdao Feng et al.

#20537

Retrieval is Not Enough: Enhancing RAG through Test-Time Critique and Optimization

Jiaqi Wei, Hao Zhou, Xiang Zhang et al.

NEURIPS 2025posterarXiv:2502.04580

#20538

Technical Debt in In-Context Learning: Diminishing Efficiency in Long Context

Taejong Joo, Diego Klabjan

#20539

Variance-Based Membership Inference Attacks Against Large-Scale Image Captioning Models

Daniel Samira, Edan Habler, Yuval Elovici et al.

CVPR 2025posterarXiv:2503.09402

#20540

VLog: Video-Language Models by Generative Retrieval of Narration Vocabulary

Kevin Qinghong Lin, Mike Zheng Shou

#20541

From Pose to Muscle: Multimodal Learning for Piano Hand Muscle Electromyography

RUOFAN LIU, YICHEN PENG, Takanori Oku et al.

#20542

AdvEDM: Fine-grained Adversarial Attack against VLM-based Embodied Agents

Yichen Wang, Hangtao Zhang, Hewen Pan et al.

CVPR 2025posterarXiv:2503.24374

#20543

ERUPT: Efficient Rendering with Unposed Patch Transformer

Maxim Shugaev, Vincent Chen, Maxim Karrenbach et al.

#20544

Improved Monocular Depth Prediction Using Distance Transform Over Pre-semantic Contours with Self-supervised Neural Networks

Marwane Hariat, Antoine Manzanera, David Filliat

NEURIPS 2025posterarXiv:2509.26427

#20545

Ascent Fails to Forget

Ioannis Mavrothalassitis, Pol Puigdemont, Noam Levi et al.

#20546

On the Sample Complexity of Differentially Private Policy Optimization

Yi He, Xingyu Zhou

NEURIPS 2025posterarXiv:2510.21060

#20547

CompGS: Unleashing 2D Compositionality for Compositional Text-to-3D via Dynamically Optimizing 3D Gaussians

Chongjian GE, Chenfeng Xu, Yuanfeng Ji et al.

CVPR 2025posterarXiv:2410.20723

#20548

FIRE: Robust Detection of Diffusion-Generated Images via Frequency-Guided Reconstruction Error

Beilin Chu, Xuan Xu, Xin Wang et al.

CVPR 2025posterarXiv:2412.07140

#20549

BIOMEDICA: An Open Biomedical Image-Caption Archive, Dataset, and Vision-Language Models Derived from Scientific Literature

Alejandro Lozano, Min Woo Sun, James Burgess et al.

CVPR 2025posterarXiv:2501.07171

#20550

Learning 3D Anisotropic Noise Distributions Improves Molecular Force Fields

Xixian Liu, Rui Jiao, ZHIYUAN LIU et al.

NEURIPS 2025posterarXiv:2510.22123

#20551

FOCUS: Unified Vision-Language Modeling for Interactive Editing Driven by Referential Segmentation

Fan Yang, Yousong Zhu, Xin Li et al.

NEURIPS 2025posterarXiv:2506.16806

#20552

DynaNav: Dynamic Feature and Layer Selection for Efficient Visual Navigation

Jiahui Wang, Changhao Chen

NEURIPS 2025posterarXiv:2509.21930

#20553

GUI-G1: Understanding R1-Zero-Like Training for Visual Grounding in GUI Agents

Yuqi Zhou, Sunhao Dai, Shuai Wang et al.

NEURIPS 2025posterarXiv:2505.15810

#20554

DPC: Dual-Prompt Collaboration for Tuning Vision-Language Models

Haoyang Li, Liang Wang, Chao Wang et al.

CVPR 2025posterarXiv:2503.13443

#20555

DEFT: Decompositional Efficient Fine-Tuning for Text-to-Image Models

Komal Kumar, Rao Anwer, Fahad Shahbaz Khan et al.

NEURIPS 2025posterarXiv:2509.22793

#20556

Taxonomy-Aware Evaluation of Vision-Language Models

Vésteinn Snæbjarnarson, Kevin Du, Niklas Stoehr et al.

CVPR 2025posterarXiv:2504.05457

#20557

LaViDa: A Large Diffusion Model for Vision-Language Understanding

Shufan Li, Konstantinos Kallidromitis, Hritik Bansal et al.

NEURIPS 2025spotlight

#20558

TAPT: Test-Time Adversarial Prompt Tuning for Robust Inference in Vision-Language Models

Xin Wang, Kai Chen, Jiaming Zhang et al.

CVPR 2025posterarXiv:2411.13136

#20559

Cross City Traffic Flow Generation via Retrieval Augmented Diffusion Model

Yudong Li, Jingyuan Wang, Xie Yu et al.

CVPR 2025posterarXiv:2502.20762

#20560

Towards Practical Real-Time Neural Video Compression

Zhaoyang Jia, Bin Li, Jiahao Li et al.

#20561

CDI: Copyrighted Data Identification in Diffusion Models

Jan Dubiński, Antoni Kowalczuk, Franziska Boenisch et al.

CVPR 2025posterarXiv:2411.12858

#20562

Binarized Neural Network for Multi-spectral Image Fusion

Junming Hou, Xiaoyu Chen, Ran Ran et al.

CVPR 2025posterarXiv:2503.11143

#20563

GaussianIP: Identity-Preserving Realistic 3D Human Generation via Human-Centric Diffusion Prior

Zichen Tang, Yuan Yao, Miaomiao Cui et al.

#20564

Quantifying Uncertainty in Error Consistency: Towards Reliable Behavioral Comparison of Classifiers

Thomas Klein, Sascha Meyen, Wieland Brendel et al.

NEURIPS 2025oralarXiv:2507.06645

#20565

Sim-to-Real Causal Transfer: A Metric Learning Approach to Causally-Aware Interaction Representations

Ahmad Rahimi, Po-Chien Luan, Yuejiang Liu et al.

CVPR 2025posterarXiv:2312.04540

#20566

Automated Model Discovery via Multi-modal & Multi-step Pipeline

Lee Jung-Mok, Nam Hyeon-Woo, Moon Ye-Bin et al.

NEURIPS 2025posterarXiv:2509.25946

#20567

Holmes-VAU: Towards Long-term Video Anomaly Understanding at Any Granularity

Huaxin Zhang, Xiaohao Xu, Xiang Wang et al.

CVPR 2025highlightarXiv:2412.06171

#20568

MOS-Attack: A Scalable Multi-objective Adversarial Attack Framework

Ping Guo, Cheng Gong, Fei Liu et al.

CVPR 2025posterarXiv:2501.07251

#20569

Weakly Supervised Semantic Segmentation via Progressive Confidence Region Expansion

Xiangfeng Xu, Pinyi Zhang, Wenxuan Huang et al.

#20570

Dynamic Siamese Expansion Framework for Improving Robustness in Online Continual Learning

Fei Ye, Yulong Zhao, Qihe Liu et al.

NEURIPS 2025posterarXiv:2509.01486

#20571

Prior-Guided Flow Matching for Target-Aware Molecule Design with Learnable Atom Number

Jingyuan Zhou, Hao Qian, Shikui Tu et al.

#20572

Confusion-Driven Self-Supervised Progressively Weighted Ensemble Learning for Non-Exemplar Class Incremental Learning

Kai Hu, Zhang Yu, Yuan Zhang et al.

NEURIPS 2025posterarXiv:2511.02712

#20573

VidEmo: Affective-Tree Reasoning for Emotion-Centric Video Foundation Models

Zhicheng Zhang, Weicheng Wang, Yongjie Zhu et al.

#20574

QiMeng-SALV: Signal-Aware Learning for Verilog Code Generation

Yang Zhang, Rui Zhang, Jiaming Guo et al.

NEURIPS 2025posterarXiv:2510.19296

#20575

Disentangled Pose and Appearance Guidance for Multi-Pose Generation

Tengfei Xiao, Yue Wu, Yuelong Li et al.

#20576

Regional Explanations: Bridging Local and Global Variable Importance

Salim I. Amoukou, Nicolas Brunel

CVPR 2025posterarXiv:2410.06241

#20577

ByTheWay: Boost Your Text-to-Video Generation Model to Higher Quality in a Training-free Way

Jiazi Bu, Pengyang Ling, Pan Zhang et al.

#20578

Social World Model-Augmented Mechanism Design Policy Learning

Xiaoyuan Zhang, Yizhe Huang, Chengdong Ma et al.

NEURIPS 2025posterarXiv:2510.19270

#20579

No-Regret Thompson Sampling for Finite-Horizon Markov Decision Processes with Gaussian Processes

Jasmine Bayrooti, Sattar Vakili, Amanda Prorok et al.

NEURIPS 2025oralarXiv:2510.20725

#20580

SeCon-RAG: A Two-Stage Semantic Filtering and Conflict-Free Framework for Trustworthy RAG

Xiaonan Si, Meilin Zhu, Simeng Qin et al.

NEURIPS 2025posterarXiv:2510.09710

#20581

Can MLLMs Absorb Math Reasoning Abilities from LLMs as Free Lunch?

Yijie Hu, Zihao Zhou, Kaizhu Huang et al.

NEURIPS 2025posterarXiv:2510.14387

#20582

Learning Conditional Space-Time Prompt Distributions for Video Class-Incremental Learning

Xiaohan Zou, Wenchao Ma, Shu Zhao

#20583

Convex Combination Star Shape Prior for Data-driven Image Semantic Segmentation

Xinyu Zhao, Jun Xie, Shengzhe Chen et al.

NEURIPS 2025posterarXiv:2510.24288

#20584

Problem-Parameter-Free Decentralized Bilevel Optimization

Zhiwei Zhai, Wenjing Yan, Ying-Jun Zhang

#20585

Rethinking Personalized Aesthetics Assessment: Employing Physique Aesthetics Assessment as An Exemplification

Haobin Zhong, Shuai He, Anlong Ming et al.

#20586

Learning Memory-Enhanced Improvement Heuristics for Flexible Job Shop Scheduling

Jiaqi Wang, Zhiguang Cao, Peng Zhao et al.

#20587

Adaptive and Multi-scale Affinity Alignment for Hierarchical Contrastive Learning

Jiawei Huang, Minming Li, Hu Ding

CVPR 2025posterarXiv:2412.01203

#20588

Boosting Knowledge Utilization in Multimodal Large Language Models via Adaptive Logits Fusion and Attention Reallocation

Wenbin An, Jiahao Nie, Feng Tian et al.

NEURIPS 2025oral

#20589

Domain Adaptive Diabetic Retinopathy Grading with Model Absence and Flowing Data

Wenxin Su, Song Tang, Xiaofeng Liu et al.

#20590

VideoREPA: Learning Physics for Video Generation through Relational Alignment with Foundation Models

Xiangdong Zhang, Jiaqi Liao, Shaofeng Zhang et al.

NEURIPS 2025oralarXiv:2505.23656

#20591

SCFlow2: Plug-and-Play Object Pose Refiner with Shape-Constraint Scene Flow

Qingyuan Wang, Rui Song, Jiaojiao Li et al.

CVPR 2025posterarXiv:2504.09160

#20592

GoLF-NRT: Integrating Global Context and Local Geometry for Few-Shot View Synthesis

You Wang, Li Fang, Hao Zhu et al.

CVPR 2025posterarXiv:2505.19813

#20593

SpatialLLM: A Compound 3D-Informed Design towards Spatially-Intelligent Large Multimodal Models

Wufei Ma, Luoxin Ye, Nessa McWeeney et al.

CVPR 2025highlightarXiv:2505.00788

#20594

Semi-Supervised State-Space Model with Dynamic Stacking Filter for Real-World Video Deraining

Shangquan Sun, Wenqi Ren, Juxiang Zhou et al.

CVPR 2025posterarXiv:2505.16811

#20595

Streaming Audio Generation from Discrete Tokens via Streaming Flow Matching

Ha-Yeong Choi, Sang-Hoon Lee

#20596

Targeted Maximum Likelihood Learning: An Optimization Perspective

Diyang Li, Kyra Gan

#20597

EntropyMark: Towards More Harmless Backdoor Watermark via Entropy-based Constraint for Open-source Dataset Copyright Protection

Ming Sun, Rui Wang, Zixuan Zhu et al.

#20598

Rethinking the Adversarial Robustness of Multi-Exit Neural Networks in an Attack-Defense Game

Keyizhi Xu, Chi Zhang, Zhan Chen et al.

#20599

AegisGuard: RL-Guided Adapter Tuning for TEE-Based Efficient & Secure On-Device Inference

CHE WANG, Ziqi Zhang, Yinggui Wang et al.