Most Cited 2025 &quot;microtransactions&quot; Papers

#20806

AdaDARE-gamma: Balancing Stability and Plasticity in Multi-modal LLMs through Efficient Adaptation

Jingyi Xie, Jintao Yang, Zhunchen Luo et al.

#20807

Fingerprinting Denoising Diffusion Probabilistic Models

Huan Teng, Yuhui Quan, Chengyu Wang et al.

#20808

Query Efficient Black-Box Visual Prompting with Subspace Learning

Haozhen Zhang, Zhaogeng Liu, Hualin Zhang et al.

#20809

Learning Urban Climate Dynamics via Physics-Guided Urban Surface–Atmosphere Interactions

Jiyang Xia, Fenghua Ling, Zhenhui Jessie Li et al.

CVPR 2025posterarXiv:2411.10013

#20810

Aligning and Prompting Anything for Zero-Shot Generalized Anomaly Detection

Jitao Ma, Weiying Xie, Hangyu Ye et al.

AAAI 2025paper

#20811

Efficient Depth Estimation for Unstable Stereo Camera Systems on AR Glasses

Yongfan Liu, Hyoukjun Kwon

#20812

Seeing is Not Believing: Adversarial Natural Object Optimization for Hard-Label 3D Scene Attacks

Daizong Liu, Wei Hu

#20813

Once-Tuning-Multiple-Variants: Tuning Once and Expanded as Multiple Vision-Language Model Variants

Chong Yu, Tao Chen, Zhongxue Gan

#20814

Hypergraph-Enhanced Contrastive Learning for Multi-View Clustering with Hyper-Laplacian Regularization

Zhibin Gu, weili wang

NEURIPS 2025posterarXiv:2506.20233

#20815

Identifying multi-compartment Hodgkin-Huxley models with high-density extracellular voltage recordings

Ian Christopher Tanoh, Michael Deistler, Jakob H Macke et al.

#20816

Heterogeneous Skeleton-Based Action Representation Learning

Xiaoyan Ma, jidong kuang, Hongsong Wang et al.

CVPR 2025posterarXiv:2506.03481

#20817

Recurrent Feature Mining and Keypoint Mixup Padding for Category-Agnostic Pose Estimation

Junjie Chen, Weilong Chen, Yifan Zuo et al.

CVPR 2025posterarXiv:2503.21140

#20818

Seeing Speech and Sound: Distinguishing and Locating Audio Sources in Visual Scenes

Hyeonggon Ryu, Seongyu Kim, Joon Chung et al.

CVPR 2025posterarXiv:2503.01899

#20819

FASTer: Focal token Acquiring-and-Scaling Transformer for Long-term 3D Objection Detection

Chenxu Dang, Pei An, Xinmin Zhang et al.

#20820

$\textit{HiMaCon:}$ Discovering Hierarchical Manipulation Concepts from Unlabeled Multi-Modal Data

Ruizhe Liu, Pei Zhou, Qian Luo et al.

CVPR 2025posterarXiv:2412.13573

#20821

Seeking Consistent Flat Minima for Better Domain Generalization via Refining Loss Landscapes

Aodi Li, Liansheng Zhuang, Xiao Long et al.

#20822

Detect-and-Guide: Self-regulation of Diffusion Models for Safe Text-to-Image Generation via Guideline Token Optimization

Feifei Li, Mi Zhang, Yiming Sun et al.

CVPR 2025posterarXiv:2503.15197

#20823

Beyond Local Sharpness: Communication-Efficient Global Sharpness-aware Minimization for Federated Learning

Debora Caldarola, Pietro Cagnasso, Barbara Caputo et al.

CVPR 2025posterarXiv:2412.03752

#20824

DAPO: An Open-Source LLM Reinforcement Learning System at Scale

Qiying Yu, Zheng Zhang, Ruofei Zhu et al.

NEURIPS 2025posterarXiv:2503.14476

#20825

LoKi: Low-dimensional KAN for Efficient Fine-tuning Image Models

Xuan Cai, Renjie Pan, Hua Yang

CVPR 2025highlightarXiv:2503.08344

#20826

DIV-FF: Dynamic Image-Video Feature Fields For Environment Understanding in Egocentric Videos

Lorenzo Mur-Labadia, Jose J. Guerrero, Ruben Martinez-Cantin

#20827

AdMiT: Adaptive Multi-Source Tuning in Dynamic Environments

Xiangyu Chang, Fahim Faisal Niloy, Sk Miraj Ahmed et al.

#20828

Spectral Learning for Infinite-Horizon Average-Reward POMDPs

Alessio Russo, Alberto Maria Metelli, Marcello Restelli

#20829

Viewpoint Rosetta Stone: Unlocking Unpaired Ego-Exo Videos for View-invariant Representation Learning

Mi Luo, Zihui Xue, Alex Dimakis et al.

#20830

GIF: Generative Inspiration for Face Recognition at Scale

Mohammad Saadabadi Saadabadi, Sahar Rahimi Malakshan, Ali Dabouei et al.

NEURIPS 2025posterarXiv:2410.06019

#20831

Unveiling Transformer Perception by Exploring Input Manifolds

Alessandro Benfenati, Alfio Ferrara, Alessio Marta et al.

#20832

Robustifying Learning-Augmented Caching Efficiently without Compromising 1-Consistency

Peng Chen, Hailiang Zhao, Jiaji Zhang et al.

NEURIPS 2025posterarXiv:2507.16242

#20833

CrossSDF: 3D Reconstruction of Thin Structures From Cross-Sections

Thomas Walker, Salvatore Esposito, Daniel Rebain et al.

CVPR 2025posterarXiv:2412.04120

#20834

Looking Beyond the Known: Towards a Data Discovery Guided Open-World Object Detection

Anay Majee, Amitesh Gangrade, Rishabh Iyer

NEURIPS 2025posterarXiv:2510.00303

#20835

Investigating the Role of Weight Decay in Enhancing Nonconvex SGD

Tao Sun, Yuhao Huang, Li Shen et al.

NEURIPS 2025oralarXiv:2510.15978

#20836

DAWP: A framework for global observation forecasting via Data Assimilation and Weather Prediction in satellite observation space

Junchao Gong, Jingyi Xu, Ben Fei et al.

#20837

MaskGWM: A Generalizable Driving World Model with Video Mask Reconstruction

Jingcheng Ni, Yuxin Guo, Yichen Liu et al.

CVPR 2025posterarXiv:2502.11663

#20838

Vad-R1: Towards Video Anomaly Reasoning via Perception-to-Cognition Chain-of-Thought

Chao Huang, Benfeng Wang, Wei Wang et al.

NEURIPS 2025posterarXiv:2505.19877

#20839

Autoregressive Motion Generation with Gaussian Mixture-Guided Latent Sampling

Linnan Tu, Lingwei Meng, Zongyi Li et al.

#20840

AVQACL: A Novel Benchmark for Audio-Visual Question Answering Continual Learning

Kaixuan Wu, Xinde Li, Xinglin Li et al.

#20841

Tackling Continual Offline RL through Selective Weights Activation on Aligned Spaces

Jifeng Hu, Sili Huang, Li Shen et al.

#20842

Value-Guided Decision Transformer: A Unified Reinforcement Learning Framework for Online and Offline Settings

Hongling Zheng, Li Shen, Yong Luo et al.

NEURIPS 2025oralarXiv:2509.21783

#20843

Prompt-guided Disentangled Representation for Action Recognition

tianci wu, Guangming Zhu, Lu jiang et al.

#20844

IPSI: Enhancing Structural Inference with Automatically Learned Structural Priors

Zhongben Gong, Xiaoqun Wu, Mingyang Zhou

CVPR 2025posterarXiv:2503.01407

#20845

Divide and Conquer: Heterogeneous Noise Integration for Diffusion-based Adversarial Purification

Gaozheng Pei, Shaojie Lyu, Gong Chen et al.

#20846

Foley-Flow: Coordinated Video-to-Audio Generation with Masked Audio-Visual Alignment and Dynamic Conditional Flows

Shentong Mo, Yibing Song

#20847

DL2G: Degradation-guided Local-to-Global Restoration for Eyeglass Reflection Removal

Yizhilv, Xiao Lu, Hong Ding et al.

#20848

Efficient Decoupled Feature 3D Gaussian Splatting via Hierarchical Compression

Zhenqi Dai, Ting Liu, Yanning Zhang

#20849

PANGEA: Projection-Based Augmentation with Non-Relevant General Data for Enhanced Domain Adaptation in LLMs

Seungyoo Lee, Giung Nam, Moonseok Choi et al.

CVPR 2025posterarXiv:2506.09989

#20850

Hearing Hands: Generating Sounds from Physical Interactions in 3D Scenes

Yiming Dou, Wonseok Oh, Yuqing Luo et al.

#20851

OmniZoom: A Universal Plug-and-Play Paradigm for Cross-Device Smooth Zoom Interpolation

Xiaoan Zhu, Yue Zhao, Tianyang Hu et al.

#20852

Domain Generalization in CLIP via Learning with Diverse Text Prompts

Changsong Wen, Zelin Peng, Yu Huang et al.

CVPR 2025posterarXiv:2503.09419

#20853

Alias-Free Latent Diffusion Models: Improving Fractional Shift Equivariance of Diffusion Latent Space

Yifan Zhou, Zeqi Xiao, Shuai Yang et al.

#20854

Weakly Supervised Contrastive Adversarial Training for Learning Robust Features from Semi-supervised Data

Lilin Zhang, Chengpei Wu, Ning Yang

CVPR 2025posterarXiv:2503.11032

#20855

DualCnst: Enhancing Zero-Shot Out-of-Distribution Detection via Text-Image Consistency in Vision-Language Models

Fayi Le, Wenwu He, Chentao Cao et al.

NEURIPS 2025posterarXiv:2505.15818

#20856

InstructSAM: A Training-free Framework for Instruction-Oriented Remote Sensing Object Recognition

Yijie Zheng, Weijie Wu, Qingyun Li et al.

#20857

CarPlanner: Consistent Auto-regressive Trajectory Planning for Large-Scale Reinforcement Learning in Autonomous Driving

Dongkun Zhang, Jiaming Liang, Ke Guo et al.

CVPR 2025posterarXiv:2502.19908

#20858

UCM-VeID V2: A Richer Dataset and A Pre-training Method for UAV Cross-Modality Vehicle Re-Identification

Xingyue Liu, Jiahao Qi, Chen Chen et al.

#20859

Unboxed: Geometrically and Temporally Consistent Video Outpainting

Zhongrui Yu, Martina Megaro-Boldini, Robert Sumner et al.

NEURIPS 2025posterarXiv:2305.08813

#20860

Better NTK Conditioning: A Free Lunch from (ReLU) Nonlinear Activation in Wide Neural Networks

Chaoyue Liu, Han Bi, Like Hui et al.

#20861

Pattern-Guided Adaptive Prior for Structure Learning

Lyuzhou Chen, Yijia Sun, Yanze Gao et al.

CVPR 2025posterarXiv:2412.06774

#20862

Visual Lexicon: Rich Image Features in Language Space

XuDong Wang, Xingyi Zhou, Alireza Fathi et al.

#20863

Continual SFT Matches Multimodal RLHF with Negative Supervision

Ke Zhu, Yu Wang, Yanpeng Sun et al.

CVPR 2025posterarXiv:2411.14797

#20864

BigCharts-R1: Enhanced Chart Reasoning with Visual Reinforcement Finetuning

Ahmed Masry, Abhay Puri, Masoud Hashemi et al.

COLM 2025paper

#20865

From Pretraining to Pathology: How Noise Leads to Catastrophic Inheritance in Medical Models

HAO SUN, Zhongyi Han, Hao Chen et al.

NEURIPS 2025posterarXiv:2510.18583

#20866

CovMatch: Cross-Covariance Guided Multimodal Dataset Distillation with Trainable Text Encoder

Yongmin Lee, Hye Won Chung

#20867

Decoupled Motion Expression Video Segmentation

Hao Fang, Runmin Cong, Xiankai Lu et al.

#20868

Mixture of Submodules for Domain Adaptive Person Search

Minsu Kim, Seungryong Kim, Kwanghoon Sohn

#20869

Unsupervised Discovery of Facial Landmarks and Head Pose

Satyajit Tourani, Siddharth Tourani, Arif Mahmood et al.

CVPR 2025posterarXiv:2409.14983

#20870

Dynamic Integration of Task-Specific Adapters for Class Incremental Learning

Jiashuo Li, Shaokun Wang, Bo Qian et al.

#20871

Depth-Width Tradeoffs for Transformers on Graph Tasks

Gilad Yehudai, Clayton Sanford, Maya Bechler-Speicher et al.

NEURIPS 2025spotlight

#20872

Transition Matching: Scalable and Flexible Generative Modeling

Neta Shaul, Uriel Singer, Itai Gat et al.

NEURIPS 2025posterarXiv:2506.23589

#20873

Test-time Augmentation Improves Efficiency in Conformal Prediction

Divya M Shanmugam, Helen Lu, Swami Sankaranarayanan et al.

CVPR 2025posterarXiv:2505.22764

#20874

GREAT: Geometry-Intention Collaborative Inference for Open-Vocabulary 3D Object Affordance Grounding

Yawen Shao, Wei Zhai, Yuhang Yang et al.

CVPR 2025posterarXiv:2411.19626

#20875

Dual Diffusion for Unified Image Generation and Understanding

Zijie Li, Henry Li, Yichun Shi et al.

CVPR 2025posterarXiv:2501.00289

#20876

Commonsense Video Question Answering through Video-Grounded Entailment Tree Reasoning

Huabin Liu, Filip Ilievski, Cees G. M. Snoek

CVPR 2025posterarXiv:2501.05069

#20877

Enduring, Efficient and Robust Trajectory Prediction Attack in Autonomous Driving via Optimization-Driven Multi-Frame Perturbation Framework

Yi Yu, Weizhen Han, Libing Wu et al.

CVPR 2025highlight

#20878

AR-RAG: Autoregressive Retrieval Augmentation for Image Generation

Jingyuan Qi, Zhiyang Xu, Qifan Wang et al.

NEURIPS 2025posterarXiv:2506.06962

#20879

UNEM: UNrolled Generalized EM for Transductive Few-Shot Learning

Long Zhou, Fereshteh Shakeri, Aymen Sadraoui et al.

CVPR 2025posterarXiv:2412.16739

#20880

Flash-Split: 2D Reflection Removal with Flash Cues and Latent Diffusion Separation

Tianfu Wang, Mingyang Xie, Haoming Cai et al.

CVPR 2025posterarXiv:2501.00637

#20881

Periodic Skill Discovery

Jonghae Park, Daesol Cho, Jusuk Lee et al.

NEURIPS 2025oralarXiv:2511.03187

#20882

Enhancing Training Data Attribution with Representational Optimization

Weiwei Sun, Haokun Liu, Nikhil Kandpal et al.

NEURIPS 2025spotlightarXiv:2505.18513

#20883

Test-Time Backdoor Detection for Object Detection Models

Hangtao Zhang, Yichen Wang, Shihui Yan et al.

CVPR 2025posterarXiv:2503.15293

#20884

Classifier-Free Guidance Inside the Attraction Basin May Cause Memorization

Anubhav Jain, Yuya Kobayashi, Takashi Shibuya et al.

CVPR 2025posterarXiv:2411.16738

#20885

PoseCrafter: Extreme Pose Estimation with Hybrid Video Synthesis

Qing Mao, Tianxin Huang, Yu Zhu et al.

NEURIPS 2025posterarXiv:2510.19527

#20886

AceReason-Nemotron: Advancing Math and Code Reasoning through Reinforcement Learning

Yang Chen, Zhuolin Yang, Zihan Liu et al.

NEURIPS 2025posterarXiv:2505.16400

#20887

Multiclass Loss Geometry Matters for Generalization of Gradient Descent in Separable Classification

Matan Schliserman, Tomer Koren

NEURIPS 2025posterarXiv:2505.22359

#20888

Reconciling Stochastic and Deterministic Strategies for Zero-shot Image Restoration using Diffusion Model in Dual

Chong Wang, Lanqing Guo, Zixuan Fu et al.

CVPR 2025posterarXiv:2503.01288

#20889

Harnessing Frequency Spectrum Insights for Image Copyright Protection Against Diffusion Models

Zhenguang Liu, Chao Shuai, Shaojing Fan et al.

CVPR 2025posterarXiv:2503.11071

#20890

Gain from Neighbors: Boosting Model Robustness in the Wild via Adversarial Perturbations Toward Neighboring Classes

Zhou Yang, Mingtao Feng, Tao Huang et al.

#20891

Denoising Trajectory Biases for Zero-Shot AI-Generated Image Detection

Yachao Liang, Min Yu, Gang Li et al.

CVPR 2025posterarXiv:2503.23538

#20892

Enhancing Creative Generation on Stable Diffusion-based Models

Jiyeon Han, Dahee Kwon, Gayoung Lee et al.

#20893

EquiPose: Exploiting Permutation Equivariance for Relative Camera Pose Estimation

Yuzhen Liu, Qiulei Dong

CVPR 2025posterarXiv:2412.15190

#20894

EarthDial: Turning Multi-sensory Earth Observations to Interactive Dialogues

Sagar Soni, Akshay Dudhane, Hiyam Debary et al.

#20895

SPFL: Sequential updates with Parallel aggregation for Enhanced Federated Learning under Category and Domain Shifts

Haoyuan Liang, Shilei Cao, Li et al.

#20896

Bridging Scales: Spectral Theory Reveals How Local Connectivity Rules Sculpt Global Neural Dynamics in Spatially Extended Networks

Yuhan Huang, Keren Gao, Dongping Yang et al.

CVPR 2025posterarXiv:2504.14254

#20897

Visual Consensus Prompting for Co-Salient Object Detection

Jie Wang, Nana Yu, Zihao Zhang et al.

#20898

AlignVLM: Bridging Vision and Language Latent Spaces for Multimodal Document Understanding

Ahmed Masry, Juan Rodriguez, Tianyu Zhang et al.

NEURIPS 2025posterarXiv:2502.01341

#20899

Classifier-guided CLIP Distillation for Unsupervised Multi-label Classification

Dongseob Kim, Hyunjung Shim

CVPR 2025posterarXiv:2503.16873

#20900

GeoVideo: Introducing Geometric Regularization into Video Generation Model

Yunpeng Bai, Shaoheng Fang, Chaohui Yu et al.

NEURIPS 2025oralarXiv:2512.03453

#20901

UniGoal: Towards Universal Zero-shot Goal-oriented Navigation

Hang Yin, Xiuwei Xu, Linqing Zhao et al.

CVPR 2025posterarXiv:2503.10630

#20902

Floating No More: Object-Ground Reconstruction from a Single Image

Yunze Man, Yichen Sheng, Jianming Zhang et al.

CVPR 2025posterarXiv:2407.18914

#20903

pFedMxF: Personalized Federated Class-Incremental Learning with Mixture of Frequency Aggregation

Yifei Zhang, Hao Zhu, Alysa Ziying Tan et al.

CVPR 2025posterarXiv:2412.10122

#20904

The Art of Deception: Color Visual Illusions and Diffusion Models

Alexandra Gomez-Villa, Kai Wang, C.Alejandro Parraga et al.

#20905

RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis

Haolin Li, Tianjie Dai, Zhe Chen et al.

NEURIPS 2025posterarXiv:2509.19980

#20906

ACAttack: Adaptive Cross Attacking RGB-T Tracker via Multi-Modal Response Decoupling

Xinyu Xiang, Qinglong Yan, HAO ZHANG et al.

#20907

RoomEditor: High-Fidelity Furniture Synthesis with Parameter-Sharing U-Net

Zhenyi Lin, Xiaofan Ming, Qilong Wang et al.

CVPR 2025posterarXiv:2505.10046

#20908

Exploring the Deep Fusion of Large Language Models and Diffusion Transformers for Text-to-Image Synthesis

Bingda Tang, Sayak Paul, Boyang Zheng et al.

#20909

SemiETS: Integrating Spatial and Content Consistencies for Semi-Supervised End-to-end Text Spotting

Dongliang Luo, Hanshen Zhu, Ziyang Zhang et al.

CVPR 2025posterarXiv:2504.09966

#20910

Quantifying Elicitation of Latent Capabilities in Language Models

Elizabeth Donoway, Hailey Joren, Arushi Somani et al.

CVPR 2025posterarXiv:2408.14506

#20911

Distilling Long-tailed Datasets

Zhenghao Zhao, Haoxuan Wang, Yuzhang Shang et al.

#20912

Knowledge Memorization and Rumination for Pre-trained Model-based Class-Incremental Learning

Zijian Gao, Wangwang Jia, Xingxing Zhang et al.

NEURIPS 2025posterarXiv:2505.17356

#20913

Adversarial Robustness of Nonparametric Regression

Parsa Moradi, Hanzaleh Nodehi, Mohammad Maddah-Ali

#20914

Pose Splatter: A 3D Gaussian Splatting Model for Quantifying Animal Pose and Appearance

Jack Goffinet, Youngjo Min, Carlo Tomasi et al.

NEURIPS 2025oralarXiv:2505.18342

#20915

Treasure Hunt: Real-time Targeting of the Long Tail using Training-Time Markers

Daniel Dsouza, Julia Kreutzer, Adrien Morisot et al.

NEURIPS 2025posterarXiv:2506.14702

#20916

SDTagNet: Leveraging Text-Annotated Navigation Maps for Online HD Map Construction

Fabian Immel, Jan-Hendrik Pauls, Richard Schwarzkopf et al.

NEURIPS 2025posterarXiv:2506.08997

#20917

PQPP: A Joint Benchmark for Text-to-Image Prompt and Query Performance Prediction

Eduard Poesina, Adriana Valentina Costache, Adrian-Gabriel Chifu et al.

CVPR 2025posterarXiv:2406.04746

#20918

CheXwhatsApp: A Dataset for Exploring Challenges in the Diagnosis of Chest X-rays through Mobile Devices

Mariamma Antony, Rajiv Porana, Sahil M. Lathiya et al.

NEURIPS 2025posterarXiv:2508.15051

#20919

Robust Estimation Under Heterogeneous Corruption Rates

Syomantak Chaudhuri, Jerry Li, Thomas Courtade

#20920

Single-Teacher View Augmentation: Boosting Knowledge Distillation via Angular Diversity

Seonghoon Yu, Dongjun Nam, Dina Katabi et al.

NEURIPS 2025posterarXiv:2510.22480

#20921

Learning to Steer: Input-dependent Steering for Multimodal LLMs

Jayneel Parekh, Pegah KHAYATAN, Mustafa Shukor et al.

NEURIPS 2025posterarXiv:2508.12815

#20922

From Prototypes to General Distributions: An Efficient Curriculum for Masked Image Modeling

Jinhong Lin, Cheng-En Wu, Huanran Li et al.

CVPR 2025posterarXiv:2411.10685

#20923

pLSTM: parallelizable Linear Source Transition Mark networks

Korbinian Pöppel, Richard Freinschlag, Thomas Schmied et al.

NEURIPS 2025posterarXiv:2506.11997

#20924

SINR: Sparsity Driven Compressed Implicit Neural Representations

Dhananjaya Jayasundara, Sudarshan Rajagopalan, Yasiru Ranasinghe et al.

CVPR 2025posterarXiv:2503.19576

#20925

Trajectory Graph Learning: Aligning with Long Trajectories in Reinforcement Learning Without Reward Design

Yunfan Li, Eric Liu, Lin Yang

NEURIPS 2025spotlight

#20926

Practical and Effective Code Watermarking for Large Language Models

Zhimeng Guo, Minhao Cheng

NEURIPS 2025posterarXiv:2507.00981

#20927

Evaluating Robustness of Monocular Depth Estimation with Procedural Scene Perturbations

Jack Nugent, Siyang Wu, Zeyu Ma et al.

#20928

Erase Diffusion: Empowering Object Removal Through Calibrating Diffusion Pathways

Yi Liu, Hao Zhou, Benlei Cui et al.

CVPR 2025highlightarXiv:2503.07026

#20929

DVHGNN: Multi-Scale Dilated Vision HGNN for Efficient Vision Recognition

Caoshuo Li, Tanzhe Li, Xiaobin Hu et al.

CVPR 2025posterarXiv:2503.14867

#20930

C-NAV: Towards Self-Evolving Continual Object Navigation in Open World

MingMing Yu, Fei Zhu, Wenzhuo Liu et al.

NEURIPS 2025oralarXiv:2510.20685

#20931

RobSense: A Robust Multi-modal Foundation Model for Remote Sensing with Static, Temporal, and Incomplete Data Adaptability

Minh Kha Do, Kang Han, Phu Lai et al.

#20932

MESC-3D:Mining Effective Semantic Cues for 3D Reconstruction from a Single Image

Shaoming Li, Qing Cai, Songqi KONG et al.

CVPR 2025posterarXiv:2411.17474

#20933

Probing the Mid-level Vision Capabilities of Self-Supervised Learning

Xuweiyi Chen, Markus Marks, Zezhou Cheng

#20934

ConceptGuard: Continual Personalized Text-to-Image Generation with Forgetting and Confusion Mitigation

Zirun Guo, Tao Jin

CVPR 2025posterarXiv:2503.10358

#20935

Diffusion Bridge: Leveraging Diffusion Model to Reduce the Modality Gap Between Text and Vision for Zero-Shot Image Captioning

Jeongryong Lee, Yejee Shin, Geonhui Son et al.

NEURIPS 2025posterarXiv:2510.25818

#20936

ScaleDiff: Higher-Resolution Image Synthesis via Efficient and Model-Agnostic Diffusion

Sungho Koh, SeungJu Cha, Hyunwoo Oh et al.

#20937

The Devil is in the Prompts: Retrieval-Augmented Prompt Optimization for Text-to-Video Generation

Bingjie Gao, Xinyu Gao, Xiaoxue Wu et al.

CVPR 2025posterarXiv:2504.11739

#20938

Progress Reward Model for Reinforcement Learning via Large Language Models

Xiuhui Zhang, Ning Gao, Xingyu Jiang et al.

#20939

VLMs-Guided Representation Distillation for Efficient Vision-Based Reinforcement Learning

Haoran Xu, Peixi Peng, Guang Tan et al.

NEURIPS 2025posterarXiv:2510.08602

#20940

Human Texts Are Outliers: Detecting LLM-generated Texts via Out-of-distribution Detection

Cong Zeng, Shengkun Tang, Yuanzhou Chen et al.

#20941

Efficient $k$-Sparse Band–Limited Interpolation with Improved Approximation Ratio

Yang Cao, Xiaoyu Li, Zhao Song et al.

#20942

Beyond Image Classification: A Video Benchmark and Dual-Branch Hybrid Discrimination Framework for Compositional Zero-Shot Learning

Dongyao Jiang, Haodong Jing, Yongqiang Ma et al.

NEURIPS 2025posterarXiv:2510.23346

#20943

Block-Diagonal LoRA for Eliminating Communication Overhead in Tensor Parallel LoRA Serving

Xinyu Wang, Jonas M. Kübler, Kailash Budhathoki et al.

#20944

AniGrad: Anisotropic Gradient-Adaptive Sampling for 3D Reconstruction From Monocular Video

Noah Stier, Alex Rich, Pradeep Sen et al.

NEURIPS 2025posterarXiv:2505.24149

#20945

RCCDA: Adaptive Model Updates in the Presence of Concept Drift under a Constrained Resource Budget

Adam Piaseczny, Md Kamran Chowdhury Shisher, Shiqiang Wang et al.

#20946

ChatVLA-2: Vision-Language-Action Model with Open-World Reasoning

Zhongyi Zhou, Yichen Zhu, Xiaoyu Liu et al.

NEURIPS 2025posterarXiv:2510.24919

#20947

Modality-Aware SAM: Sharpness-Aware-Minimization Driven Gradient Modulation for Harmonized Multimodal Learning

Hossein Rajoli Nowdeh, Jie Ji, Xiaolong Ma et al.

#20948

Unsupervised Trajectory Optimization for 3D Registration in Serial Section Electron Microscopy using Neural ODEs

Zhenbang Zhang, Jingtong Feng, Hongjia Li et al.

NEURIPS 2025posterarXiv:2503.22976

#20949

From Flatland to Space: Teaching Vision-Language Models to Perceive and Reason in 3D

Jiahui Zhang, Yurui Chen, Yueming Xu et al.

#20950

Easy-editable Image Vectorization with Multi-layer Multi-scale Distributed Visual Feature Embedding

Ye Chen, Zhangli Hu, Zhongyin Zhao et al.

CVPR 2025posterarXiv:2411.12355

#20951

DynFocus: Dynamic Cooperative Network Empowers LLMs with Video Understanding

Yudong Han, Qingpei Guo, Liyuan Pan et al.

#20952

Automated Proof of Polynomial Inequalities via Reinforcement Learning

Banglong Liu, Niuniu Qi, Xia Zeng et al.

CVPR 2025posterarXiv:2503.06592

#20953

BIP3D: Bridging 2D Images and 3D Perception for Embodied Intelligence

Xuewu Lin, Tianwei Lin, Alan Huang et al.

CVPR 2025posterarXiv:2411.14869

#20954

MASt3R-SLAM: Real-Time Dense SLAM with 3D Reconstruction Priors

Riku Murai, Eric Dexheimer, Andrew J. Davison

CVPR 2025highlightarXiv:2412.12392

#20955

Online Inverse Linear Optimization: Efficient Logarithmic-Regret Algorithm, Robustness to Suboptimality, and Lower Bound

Shinsaku Sakaue, Taira Tsuchiya, Han Bao et al.

NEURIPS 2025posterarXiv:2501.14349

#20956

NEP: Autoregressive Image Editing via Next Editing Token Prediction

Huimin Wu, Xiaojian (Shawn) Ma, Haozhe Zhao et al.

NEURIPS 2025posterarXiv:2508.06044

#20957

Toward Robust Neural Reconstruction from Sparse Point Sets

Amine Ouasfi, Shubhendu Jena, Eric Marchand et al.

CVPR 2025posterarXiv:2412.16361

#20958

Lorentz Local Canonicalization: How to make any Network Lorentz-Equivariant

Jonas Spinner, Luigi Favaro, Peter Lippmann et al.

NEURIPS 2025posterarXiv:2505.20280

#20959

Just Dance with pi! A Poly-modal Inductor for Weakly-supervised Video Anomaly Detection

Snehashis Majhi, Giacomo D'Amicantonio, Antitza Dantcheva et al.

CVPR 2025highlight

#20960

Counterfactual Evolution of Multimodal Datasets via Visual Programming

Minghe Gao, Zhongqi Yue, Wenjie Yan et al.

NEURIPS 2025posterarXiv:2512.03571

#20961

EnCompass: Enhancing Agent Programming with Search Over Program Execution Paths

Zhening Li, Armando Solar-Lezama, Yisong Yue et al.

#20962

Gaussian Splashing: Unified Particles for Versatile Motion Synthesis and Rendering

Yutao Feng, Xiang Feng, Yintong Shang et al.

CVPR 2025posterarXiv:2401.15318

#20963

Improving Accuracy and Calibration via Differentiated Deep Mutual Learning

Han Liu, Peng Cui, Bingning Wang et al.

CVPR 2025posterarXiv:2412.00733

#20964

Hallo3: Highly Dynamic and Realistic Portrait Image Animation with Video Diffusion Transformer

Jiahao Cui, Hui Li, Qingkun Su et al.

#20965

Improving the Transferability of Adversarial Attacks on Face Recognition with Diverse Parameters Augmentation

Fengfan Zhou, Bangjie Yin, Hefei Ling et al.

CVPR 2025posterarXiv:2411.15555

#20966

AVerImaTeC: A Dataset for Automatic Verification of Image-Text Claims with Evidence from the Web

RUI CAO, Zifeng Ding, Zhijiang Guo et al.

NEURIPS 2025oralarXiv:2505.17978

#20967

Reward Fine-Tuning Two-Step Diffusion Models via Learning Differentiable Latent-Space Surrogate Reward

Zhiwei Jia, Yuesong Nan, Huixi Zhao et al.

CVPR 2025posterarXiv:2411.15247

#20968

CaricatureBooth: Data-Free Interactive Caricature Generation in a Photo Booth

Zhiyu Qu, Yunqi Miao, Zhensong Zhang et al.

#20969

Revisiting 1-peer exponential graph for enhancing decentralized learning efficiency

Kenta Niwa, Yuki Takezawa, Guoqiang Zhang et al.

NEURIPS 2025posterarXiv:2511.00220

#20970

Iterative Foundation Model Fine-Tuning on Multiple Rewards

Pouya M. Ghari, simone sciabola, Ye Wang

#20971

ENMA: Tokenwise Autoregression for Continuous Neural PDE Operators

Armand Kassaï Koupaï, Lise Le Boudec, Louis Serrano et al.

CVPR 2025posterarXiv:2503.09993

#20972

Channel-wise Noise Scheduled Diffusion for Inverse Rendering in Indoor Scenes

JunYong Choi, Min-Cheol Sagong, SeokYeong Lee et al.

#20973

Inexact Column Generation for Bayesian Network Structure Learning via Difference-of-Submodular Optimization

Yiran Yang, Rui Chen

NEURIPS 2025posterarXiv:2505.11089

#20974

Discovering Fine-Grained Visual-Concept Relations by Disentangled Optimal Transport Concept Bottleneck Models

Yan Xie, Zequn Zeng, Hao Zhang et al.

CVPR 2025posterarXiv:2505.07209

#20975

Visual Anagrams Reveal Hidden Differences in Holistic Shape Processing Across Vision Models

Fenil Doshi, Thomas Fel, Talia Konkle et al.

NEURIPS 2025posterarXiv:2507.00493

#20976

TraffiDent: A Dataset for Understanding the Interplay Between Traffic Dynamics and Incidents

Xiaochuan Gou, Ziyue Li, Tian Lan et al.

NEURIPS 2025posterarXiv:2510.19163

#20977

Natural Gradient VI: Guarantees for Non-Conjugate Models

Fangyuan Sun, Ilyas Fatkhullin, Niao He

#20978

CADGrasp: Learning Contact and Collision Aware General Dexterous Grasping in Cluttered Scenes

Jiyao Zhang, Zhiyuan Ma, Tianhao Wu et al.

NEURIPS 2025posterarXiv:2601.15039

#20979

Embodied Scene Understanding for Vision Language Models via MetaVQA

Weizhen Wang, Chenda Duan, Zhenghao Peng et al.

CVPR 2025posterarXiv:2501.09167

#20980

Learning Flow Fields in Attention for Controllable Person Image Generation

Zijian Zhou, Shikun Liu, Xiao Han et al.

CVPR 2025posterarXiv:2412.08486

#20981

VeriLoC: Line-of-Code Level Prediction of Hardware Design Quality from Verilog Code

Raghu Vamshi Hemadri, Jitendra Bhandari, Andre Nakkab et al.

NEURIPS 2025posterarXiv:2506.07239

#20982

Forming Auxiliary High-confident Instance-level Loss to Promote Learning from Label Proportions

Tianhao Ma, Han Chen, Juncheng Hu et al.

CVPR 2025posterarXiv:2411.10364

#20983

Towards Open-Vocabulary Audio-Visual Event Localization

Jinxing Zhou, Dan Guo, Ruohao Guo et al.

CVPR 2025posterarXiv:2411.11278

#20984

ADU: Adaptive Detection of Unknown Categories in Black-Box Domain Adaptation

Yushan Lai, Guowen Li, Haoyuan Liang et al.

CVPR 2025highlightarXiv:2503.18337

#20985

Coeff-Tuning: A Graph Filter Subspace View for Tuning Attention-Based Large Models

Zichen Miao, WEI CHEN, Qiang Qiu

#20986

MVBoost: Boost 3D Reconstruction with Multi-View Refinement

Xiangyu Liu, Xiaomei Zhang, Zhiyuan Ma et al.

CVPR 2025posterarXiv:2411.17772

#20987

Semi-supervised Vertex Hunting, with Applications in Network and Text Analysis

Yicong Jiang, Zheng Tracy Ke

NEURIPS 2025posterarXiv:2510.22526

#20988

Adaptive Discretization for Consistency Models

Jiayu Bai, Zhanbo Feng, Zhijie Deng et al.

NEURIPS 2025posterarXiv:2510.17266

#20989

TGA: True-to-Geometry Avatar Dynamic Reconstruction

Bo Guo, Sijia Wen, Ziwei Wang et al.

CVPR 2025posterarXiv:2405.16738

#20990

CARL: A Framework for Equivariant Image Registration

Hastings Greer, Lin Tian, François-Xavier Vialard et al.

#20991

SONAR: Long-Range Graph Propagation Through Information Waves

Alessandro Trenta, Alessio Gravina, Davide Bacciu

#20992

Online Locally Differentially Private Conformal Prediction via Binary Inquiries

Qiangqiang Zhang, Chenfei Gu, Xinwei Feng et al.

CVPR 2025posterarXiv:2411.15497

#20993

AeroGen: Enhancing Remote Sensing Object Detection with Diffusion-Driven Data Generation

Datao Tang, Xiangyong Cao, Xuan Wu et al.

#20994

UniSTD: Towards Unified Spatio-Temporal Learning across Diverse Disciplines

Chen Tang, Xinzhu Ma, Encheng Su et al.

CVPR 2025posterarXiv:2503.20748

#20995

FedFree: Breaking Knowledge-sharing Barriers through Layer-wise Alignment in Heterogeneous Federated Learning

Haizhou Du, Yiran Xiang, Yiwen Cai et al.

CVPR 2025posterarXiv:2503.12382

#20996

RENO: Real-Time Neural Compression for 3D LiDAR Point Clouds

Kang You, Tong Chen, Dandan Ding et al.

#20997

Self-Supervised Discovery of Neural Circuits in Spatially Patterned Neural Responses with Graph Neural Networks

Kijung Yoon

NEURIPS 2025posterarXiv:2509.17174

#20998

Structured Reinforcement Learning for Combinatorial Decision-Making

Heiko Hoppe, Léo Baty, Louis Bouvier et al.

NEURIPS 2025posterarXiv:2505.19053

#20999

MaskGaussian: Adaptive 3D Gaussian Representation from Probabilistic Masks

Yifei Liu, Zhihang Zhong, Yifan Zhan et al.

CVPR 2025posterarXiv:2412.20522

#21000

Forensics Adapter: Adapting CLIP for Generalizable Face Forgery Detection

Xinjie Cui, Yuezun Li, Ao Luo et al.