Most Cited 2025 Poster Papers

#6402

DreamUHD: Frequency Enhanced Variational Autoencoder for Ultra-High-Definition Image Restoration

Yidi Liu, Dong Li, Jie Xiao et al.

ICLR 2025arXiv:2410.03783

#6403

Improving Neural Optimal Transport via Displacement Interpolation

Jaemoo Choi, Yongxin Chen, Jaewoong Choi

AAAI 2025paperarXiv:2412.12996

#6404

Neural Control and Certificate Repair via Runtime Monitoring

Emily Yu, Đorđe Žikelić, Thomas A. Henzinger

ICML 2025arXiv:2505.19680

#6405

Cut out and Replay: A Simple yet Versatile Strategy for Multi-Label Online Continual Learning

Xinrui Wang, Shao-Yuan Li, Jiaqiang Zhang et al.

AAAI 2025paperarXiv:2412.10804

#6406

Medical Manifestation-Aware De-Identification

Yuan Tian, Shuo Wang, Guangtao Zhai

NEURIPS 2025spotlightarXiv:2409.03817

#6407

Neural Entropy

Akhil Premkumar

ICML 2025arXiv:2511.06164

#6408

Learning Gaussian DAG Models without Condition Number Bounds

Constantinos Daskalakis, Vardis Kandiros, Rui Yao

ICLR 2025arXiv:2410.16701

#6409

ClimaQA: An Automated Evaluation Framework for Climate Question Answering Models

Veeramakali Vignesh Manivannan, Yasaman Jafari, Srikar Eranky et al.

AAAI 2025paperarXiv:2406.11087

#6410

DP-MemArc: Differential Privacy Transfer Learning for Memory Efficient Language Models

Yanming Liu, Xinyue Peng, Yuwei Zhang et al.

AAAI 2025paperarXiv:2505.22384

#6411

Exact Algorithms and Lower Bounds for Forming Coalitions of Constrained Maximum Size

Foivos Fioravantes, Harmender Gahlawat, Nikolaos Melissinos

ICLR 2025arXiv:2409.05100

#6412

MaxCutPool: differentiable feature-aware Maxcut for pooling in graph neural networks

Carlo Abate, Filippo Maria Bianchi

#6413

PBECount: Prompt-Before-Extract Paradigm for Class-Agnostic Counting

Canchen Yang, Tianyu Geng, Jian Peng et al.

AAAI 2025paperarXiv:2412.14818

#6414

Fair Division with Social Impact

Michele Flammini, Gianluigi Greco, Giovanna Varricchio

AAAI 2025paperarXiv:2503.15908

#6415

Enhancing Close-up Novel View Synthesis via Pseudo-labeling

Jiatong Xia, Libo Sun, Lingqiao Liu

ICML 2025arXiv:2506.00736

#6416

IMPACT: Iterative Mask-based Parallel Decoding for Text-to-Audio Generation with Diffusion Modeling

Kuan Po Huang, Shu-wen Yang, Huy Phan et al.

AAAI 2025paperarXiv:2403.16513

#6417

Transfer Learning of Real Image Features with Soft Contrastive Loss for Fake Image Detection

Ziyou Liang, Weifeng Liu, Run Wang et al.

ICML 2025arXiv:2502.05888

#6418

Faster Approximation Algorithms for k-Center via Data Reduction

Arnold Filtser, Shaofeng Jiang, Yi Li et al.

NEURIPS 2025arXiv:2505.14705

#6419

Beyond Modality Collapse: Representation Blending for Multimodal Dataset Distillation

xin zhang, Ziruo Zhang, JIAWEI DU et al.

#6420

Advancing Audio-Based Text Generation with Imbalance Preference Optimization

Zhenghao Zhou, Yongjie Liu, Chen Cao

ICLR 2025arXiv:2410.06656

#6421

WardropNet: Traffic Flow Predictions via Equilibrium-Augmented Learning

Kai Jungel, Dario Paccagnan, Axel Parmentier et al.

AAAI 2025paperarXiv:2412.15878

#6422

On the Power of Strategic Corpus Enrichment in Content Creation Games

Haya Nachimovsky, Moshe Tennenholtz

#6423

Residual Diffusion Deblurring Model for Single Image Defocus Deblurring

Haoxuan Feng, Haohui Zhou, Tian Ye et al.

ICLR 2025arXiv:2501.16471

#6424

SIM: Surface-based fMRI Analysis for Inter-Subject Multimodal Decoding from Movie-Watching Experiments

Simon Dahan, Gabriel Bénédict, Logan Williams et al.

ICLR 2025arXiv:2501.03078

#6425

Qinco2: Vector Compression and Search with Improved Implicit Neural Codebooks

Théophane Vallaeys, Matthew J Muckley, Jakob Verbeek et al.

#6426

FIG: Flow with Interpolant Guidance for Linear Inverse Problems

Yici Yan, Yichi Zhang, XIANGMING MENG et al.

AAAI 2025paperarXiv:2402.02629

#6427

PROSAC: Provably Safe Certification for Machine Learning Models under Adversarial Attacks

Chen Feng, Ziquan Liu, Zhuo Zhi et al.

AAAI 2025paperarXiv:2501.07022

#6428

Improved Regret Bounds for Online Fair Division with Bandit Learning

Benjamin Schiffer, Shirley Zhang

ICLR 2025arXiv:2503.01905

#6429

PaCA: Partial Connection Adaptation for Efficient Fine-Tuning

Sunghyeon Woo, Sol Namkung, SunWoo Lee et al.

#6430

Gradient-Guided Credit Assignment and Joint Optimization for Dependency-Aware Spatial Crowdsourcing

Yafei Li, Wei Chen, Jinxing Yan et al.

ICML 2025arXiv:2407.15881

#6431

Collaborative Mean Estimation Among Heterogeneous Strategic Agents: Individual Rationality, Fairness, and Truthful Contribution

Alex Clinton, Yiding Chen, Jerry Zhu et al.

#6432

Learning Dynamic Similarity by Bidirectional Hierarchical Sliding Semantic Probe for Efficient Text Video Retrieval

Yang Liu, Shudong Huang, Deng Xiong et al.

#6433

Generalized Debiased Semi-Supervised Hashing for Large-Scale Image Retrieval

Xingbo Liu, Xuening Zhang, Xiushan Nie et al.

AAAI 2025paperarXiv:2503.17784

#6434

MEPNet: Medical Entity-Balanced Prompting Network for Brain CT Report Generation

Xiaodan Zhang, Yanzhao Shi, Junzhong Ji et al.

ICLR 2025arXiv:2502.00156

#6435

ALBAR: Adversarial Learning approach to mitigate Biases in Action Recognition

Joseph Fioresi, Ishan Rajendrakumar Dave, Mubarak Shah

ICLR 2025arXiv:2505.04599

#6436

Complexity Lower Bounds of Adaptive Gradient Algorithms for Non-convex Stochastic Optimization under Relaxed Smoothness

Michael Crawshaw, Mingrui Liu

ICLR 2025arXiv:2405.18183

#6437

Feature-Based Online Bilateral Trade

Solenne Gaucher, Martino Bernasconi, Matteo Castiglioni et al.

AAAI 2025paperarXiv:2412.16451

#6438

Correcting Large Language Model Behavior via Influence Function

Han Zhang, Zhuo Zhang, Yi Zhang et al.

ICLR 2025arXiv:2412.17701

#6439

From Models to Microtheories: Distilling a Model's Topical Knowledge for Grounded Question-Answering

Nathaniel Weir, Bhavana Dalvi Mishra, Orion Weller et al.

AAAI 2025paperarXiv:2502.03843

#6440

Improving Natural Language Understanding for LLMs via Large-Scale Instruction Synthesis

Lin Yuan, Jun Xu, Honghao Gui et al.

#6441

SSLFusion: Scale and Space Aligned Latent Fusion Model for Multimodal 3D Object Detection

Bonan Ding, Jin Xie, Jing Nie et al.

ICLR 2025arXiv:2411.01155

#6442

HG-Adapter: Improving Pre-Trained Heterogeneous Graph Neural Networks with Dual Adapters

YUJIE MO, Runpeng Yu, Xiaofeng Zhu et al.

ICLR 2025arXiv:2503.13926

#6443

Learning Shape-Independent Transformation via Spherical Representations for Category-Level Object Pose Estimation

Huan Ren, Wenfei Yang, Xiang Liu et al.

ICLR 2025arXiv:2504.09481

#6444

Rethinking the generalization of drug target affinity prediction algorithms via similarity aware evaluation

Chenbin Zhang, Zhiqiang Hu, Jiang Chuchu et al.

AAAI 2025paperarXiv:2412.19542

#6445

Interacted Object Grounding in Spatio-Temporal Human-Object Interactions

Xiaoyang Liu, Boran Wen, Xinpeng Liu et al.

ICLR 2025arXiv:2410.02226

#6446

Doubly Optimal Policy Evaluation for Reinforcement Learning

Shuze Liu, Claire Chen, Shangtong Zhang

ICLR 2025arXiv:2410.11206

#6447

Towards Understanding Why FixMatch Generalizes Better Than Supervised Learning

Jingyang Li, Jiachun Pan, Vincent Tan et al.

NEURIPS 2025oralarXiv:2507.00583

#6448

AI-Generated Video Detection via Perceptual Straightening

Christian Internò, Robert Geirhos, Markus Olhofer et al.

ICLR 2025arXiv:2503.06181

#6449

Make Haste Slowly: A Theory of Emergent Structured Mixed Selectivity in Feature Learning ReLU Networks

Devon Jarvis, Richard Klein, Benjamin Rosman et al.

ICLR 2025arXiv:2501.16944

#6450

Exact Computation of Any-Order Shapley Interactions for Graph Neural Networks

Maximilian Muschalik, Fabian Fumagalli, Paolo Frazzetto et al.

ICML 2025arXiv:2506.06280

#6451

Eigenspectrum Analysis of Neural Networks without Aspect Ratio Bias

Yuanzhe Hu, Kinshuk Goel, Vlad Killiakov et al.

AAAI 2025paperarXiv:2406.14217

#6452

Defending Against Sophisticated Poisoning Attacks with RL-based Aggregation in Federated Learning

Yujing Wang, Hainan Zhang, Sijia Wen et al.

#6453

Test-time Adaptation on Graphs via Adaptive Subgraph-based Selection and Regularized Prototypes

Ming Zhang, Qixin Zhang, Xiao Luo et al.

ICML 2025

AAAI 2025paperarXiv:2404.16423

#6454

Neural Assembler: Learning to Generate Fine-Grained Robotic Assembly Instructions from Multi-View Images

Hongyu Yan, Yadong Mu

ICML 2025arXiv:2503.12917

#6455

Verification Learning: Make Unsupervised Neuro-Symbolic System Feasible

Lin-Han Jia, Wen-Chao Hu, Jie-Jing Shao et al.

ICLR 2025arXiv:2409.00696

#6456

Polyrating: A Cost-Effective and Bias-Aware Rating System for LLM Evaluation

Jasper Dekoninck, Maximilian Baader, Martin Vechev

ICLR 2025oralarXiv:2410.14735

#6457

Agent Skill Acquisition for Large Language Models via CycleQD

So Kuroki, Taishi Nakamura, Takuya Akiba et al.

ICML 2025arXiv:2502.06861

#6458

Design Considerations in Offline Preference-based RL

Alekh Agarwal, Christoph Dann, Teodor Vanislavov Marinov

ICLR 2025arXiv:2504.03933

#6459

Language Models Are Implicitly Continuous

Samuele Marro, Davide Evangelista, X. Huang et al.

ICLR 2025arXiv:2312.08558

#6460

Leveraging Driver Field-of-View for Multimodal Ego-Trajectory Prediction

M. Eren Akbiyik, Nedko Savov, Danda Pani Paudel et al.

ICML 2025arXiv:2412.10208

#6461

Efficient Generative Modeling with Residual Vector Quantization-Based Tokens

Jaehyeon Kim, Taehong Moon, Keon Lee et al.

#6462

FakeDiffer: Distributional Disparity Learning on Differentiated Reconstruction for Face Forgery Detection

Bo Wang, Zhao Zhang, Suiyi Zhao et al.

ICLR 2025arXiv:2503.00838

#6463

Foundation Models Secretly Understand Neural Network Weights: Enhancing Hypernetwork Architectures with Foundation Models

Jeffrey Gu, Serena Yeung

NEURIPS 2025oralarXiv:2505.15438

#6464

Bridging Sign and Spoken Languages: Pseudo Gloss Generation for Sign Language Translation

Jianyuan Guo, Peike Li, Trevor Cohn

ICLR 2025arXiv:2601.07963

#6465

3DGS-Drag: Dragging Gaussians for Intuitive Point-Based 3D Editing

Jiahua Dong, Yu-Xiong Wang

ICML 2025arXiv:2410.05583

#6466

NegMerge: Sign-Consensual Weight Merging for Machine Unlearning

Hyo Seo Kim, Dongyoon Han, Junsuk Choe

AAAI 2025paperarXiv:2407.21033

#6467

Multi-Grained Query-Guided Set Prediction Network for Grounded Multimodal Named Entity Recognition

Jielong Tang, Zhenxing Wang, ZiYang Gong et al.

ICLR 2025arXiv:2410.09348

#6468

BANGS: Game-theoretic Node Selection for Graph Self-Training

Fangxin Wang, Kay Liu, Sourav Medya et al.

ICLR 2025arXiv:2406.09588

#6469

Learning Color Equivariant Representations

Yulong Yang, Felix O'Mahony, Christine Allen-Blanchette

ICLR 2025arXiv:2407.06141

#6470

CHAMP: Conformalized 3D Human Multi-Hypothesis Pose Estimators

Harry Zhang, Luca Carlone

AAAI 2025paperarXiv:2503.17059

#6471

DIDiffGes: Decoupled Semi-Implicit Diffusion Models for Real-time Gesture Generation from Speech

Yongkang Cheng, Shaoli Huang, Xuelin Chen et al.

#6472

Selective Unlearning via Representation Erasure Using Domain Adversarial Training

Nazanin Sepahvand, Eleni Triantafillou, Hugo Larochelle et al.

NEURIPS 2025arXiv:2502.06536

#6473

Sample-efficient Learning of Concepts with Theoretical Guarantees: from Data to Concepts without Interventions

Hidde Fokkema, Tim van Erven, Sara Magliacane

ICLR 2025arXiv:2405.20986

#6474

Predictive Uncertainty Quantification for Bird's Eye View Segmentation: A Benchmark and Novel Loss Function

Linlin Yu, Bowen Yang, Tianhao Wang et al.

ICLR 2025arXiv:2504.06003

#6475

econSG: Efficient and Multi-view Consistent Open-Vocabulary 3D Semantic Gaussians

Can Zhang, Gim H Lee

#6476

Adversarial-Inspired Backdoor Defense via Bridging Backdoor and Adversarial Attacks

Jia-Li Yin, Weijian Wang, Lyhwa et al.

NEURIPS 2025arXiv:2510.22994

#6477

SceneDecorator: Towards Scene-Oriented Story Generation with Scene Planning and Scene Consistency

Quanjian Song, Donghao Zhou, Jingyu Lin et al.

#6478

Neural Phylogeny: Fine-Tuning Relationship Detection among Neural Networks

Runpeng Yu, Xinchao Wang

ICLR 2025arXiv:2507.06931

#6479

DICE: Data Influence Cascade in Decentralized Learning

Tongtian Zhu, Wenhao Li, Can Wang et al.

ICLR 2025arXiv:2411.07729

#6480

Exploring The Loss Landscape Of Regularized Neural Networks Via Convex Duality

Sungyoon Kim, Aaron Mishkin, Mert Pilanci

ICML 2025arXiv:2410.14556

#6481

Measuring Diversity: Axioms and Challenges

Mikhail Mironov, Liudmila Prokhorenkova

ICLR 2025arXiv:2409.20558

#6482

Uni$^2$Det: Unified and Universal Framework for Prompt-Guided Multi-dataset 3D Detection

Yubin Wang, Zhikang Zou, Xiaoqing Ye et al.

ICLR 2025arXiv:2502.06820

#6483

LoCA: Location-Aware Cosine Adaptation for Parameter-Efficient Fine-Tuning

Zhekai Du, Yinjie Min, Jingjing Li et al.

AAAI 2025paperarXiv:2501.04579

#6484

Unified Coding for Both Human Perception and Generalized Machine Analytics with CLIP Supervision

Kangsheng Yin, Quan Liu, Xuelin Shen et al.

ICLR 2025arXiv:2503.15111

#6485

FedLWS: Federated Learning with Adaptive Layer-wise Weight Shrinking

Changlong Shi, Jinmeng Li, He Zhao et al.

ICML 2025arXiv:2410.14812

#6486

Isolated Causal Effects of Natural Language

Victoria Lin, Louis-Philippe Morency, Eli Ben-Michael

ICLR 2025arXiv:2504.00019

#6487

ObscuraCoder: Powering Efficient Code LM Pre-Training Via Obfuscation Grounding

Indraneil Paul, Haoyi Yang, Goran Glavaš et al.

AAAI 2025paperarXiv:2409.04411

#6488

Approximating Metric Magnitude of Point Sets

Rayna Andreeva, James Ward, Primoz Skraba et al.

AAAI 2025paperarXiv:2407.07778

#6489

WorldAPIs: The World Is Worth How Many APIs? A Thought Experiment

Jiefu Ou, Arda Uzunoğlu, Benjamin Van Durme et al.

#6490

Efficient Discovery of Pareto Front for Multi-Objective Reinforcement Learning

Ruohong Liu, Yuxin Pan, Linjie Xu et al.

NEURIPS 2025arXiv:2505.09371

#6491

TensorRL-QAS: Reinforcement learning with tensor networks for improved quantum architecture search

Akash Kundu, Stefano Mangini

AAAI 2025paperarXiv:2406.07828

#6492

Spatial Annealing for Efficient Few-shot Neural Rendering

Yuru Xiao, Deming Zhai, Wenbo Zhao et al.

AAAI 2025paperarXiv:2410.14586

#6493

Neural Combinatorial Clustered Bandits for Recommendation Systems

Baran Atalar, Carlee Joe-Wong

AAAI 2025paperarXiv:2412.15835

#6494

Enhancing Generalized Few-Shot Semantic Segmentation via Effective Knowledge Transfer

Xinyue Chen, Miaojing Shi, Zijian Zhou et al.

ICLR 2025arXiv:2410.10870

#6495

PortLLM: Personalizing Evolving Large Language Models with Training-Free and Portable Model Patches

Rana Muhammad Shahroz Khan, Pingzhi Li, Sukwon Yun et al.

ICML 2025oralarXiv:2506.17457

#6496

When Every Millisecond Counts: Real-Time Anomaly Detection via the Multimodal Asynchronous Hybrid Network

Dong Xiao, Guangyao Chen, Peixi Peng et al.

ICLR 2025arXiv:2409.13949

#6497

Mufu: Multilingual Fused Learning for Low-Resource Translation with LLM

Zheng Wei Lim, Nitish Gupta, Honglin Yu et al.

AAAI 2025paperarXiv:2502.04394

#6498

DECT: Harnessing LLM-assisted Fine-Grained Linguistic Knowledge and Label-Switched and Label-Preserved Data Generation for Diagnosis of Alzheimer’s Disease

Tingyu Mo, Jacqueline C. K. Lam, Victor O. K. Li et al.

ICML 2025arXiv:2406.00452

#6499

Towards a Unified Framework of Clustering-based Anomaly Detection

Zeyu Fang, Ming Gu, Sheng Zhou et al.

ICLR 2025arXiv:2410.01202

#6500

AniSDF: Fused-Granularity Neural Surfaces with Anisotropic Encoding for High-Fidelity 3D Reconstruction

Jingnan Gao, Zhuo Chen, Xiaokang Yang et al.

AAAI 2025paperarXiv:2406.01555

#6501

FIRM: Flexible Interactive Reflection ReMoval

Xiao Chen, Xudong Jiang, Yunkang Tao et al.

ICLR 2025arXiv:2511.04769

#6502

ReGen: Generative Robot Simulation via Inverse Design

Peter (Phat) Nguyen, Johnson (Tsun-Hsuan) Wang, Zhang-Wei Hong et al.

#6503

Holographic Node Representations: Pre-training Task-Agnostic Node Embeddings

Beatrice Bevilacqua, Joshua Robinson, Jure Leskovec et al.

ICLR 2025arXiv:2502.15540

#6504

Generalization Guarantees for Representation Learning via Data-Dependent Gaussian Mixture Priors

Milad Sefidgaran, Abdellatif Zaidi, Piotr Krasnowski

#6505

DreamAlign: Dynamic Text-to-3D Optimization with Human Preference Alignment

Gaofeng Liu, Zhiyuan Ma, Tao Fang

ICLR 2025arXiv:2502.09319

#6506

Bridging Jensen Gap for Max-Min Group Fairness Optimization in Recommendation

Chen Xu, Yuxin Li, Wenjie Wang et al.

ICLR 2025arXiv:2504.07566

#6507

Diffusion Transformers for Tabular Data Time Series Generation

Fabrizio Garuti, Enver Sangineto, Simone Luetto et al.

ICML 2025arXiv:2505.00663

#6508

Wasserstein Policy Optimization

David Pfau, Ian Davies, Diana Borsa et al.

ICLR 2025arXiv:2501.00891

#6509

Demystifying Online Clustering of Bandits: Enhanced Exploration Under Stochastic and Smoothed Adversarial Contexts

Zhuohua Li, Maoli Liu, Xiangxiang Dai et al.

#6510

Semi-Supervised CLIP Adaptation by Enforcing Semantic and Trapezoidal Consistency

Kai Gan, Bo Ye, Min-Ling Zhang et al.

AAAI 2025paperarXiv:2412.16414

#6511

Accelerated Methods with Compressed Communications for Distributed Optimization Problems Under Data Similarity

Dmitry Bylinkin, Aleksandr Beznosikov

#6512

DialogDraw: Image Generation and Editing System Based on Multi-Turn Dialogue

Shichao Ma, Xinfeng Zhang, Zeng Zhao et al.

#6513

ML-GOOD: Towards Multi-Label Graph Out-Of-Distribution Detection

Tingyi Cai, Yunliang Jiang, Ming Li et al.

ICLR 2025arXiv:2404.19228

#6514

Weighted Point Set Embedding for Multimodal Contrastive Learning Toward Optimal Similarity Metric

Toshimitsu Uesaka, Taiji Suzuki, Yuhta Takida et al.

ICLR 2025arXiv:2503.23508

#6515

Re-Aligning Language to Visual Objects with an Agentic Workflow

Yuming Chen, Jiangyan Feng, Haodong Zhang et al.

ICLR 2025arXiv:2412.00537

#6516

Exact Certification of (Graph) Neural Networks Against Label Poisoning

Mahalakshmi Sabanayagam, Lukas Gosch, Stephan Günnemann et al.

ICML 2025spotlightarXiv:2506.01301

#6517

Overcoming Multi-step Complexity in Multimodal Theory-of-Mind Reasoning: A Scalable Bayesian Planner

Chunhui Zhang, Zhongyu Ouyang, Kwonjoon Lee et al.

AAAI 2025paperarXiv:2412.09799

#6518

CP-DETR: Concept Prompt Guide DETR Toward Stronger Universal Object Detection

Qibo Chen, Weizhong Jin, Jianyue Ge et al.

ICLR 2025arXiv:2302.08345

#6519

Linear Bandits with Memory

Pierre Laforgue, Giulia Clerici, Nicolò Cesa-Bianchi

AAAI 2025paperarXiv:2501.04995

#6520

IPDN: Image-enhanced Prompt Decoding Network for 3D Referring Expression Segmentation

Qi Chen, Changli Wu, Jiayi Ji et al.

#6521

Rethinking Classifier Re-Training in Long-Tailed Recognition: Label Over-Smooth Can Balance

Siyu Sun, Han Lu, Jiangtong Li et al.

ICML 2025arXiv:2507.10539

#6522

Graph World Model

Tao Feng, Yexin Wu, Guanyu Lin et al.

AAAI 2025paperarXiv:2408.15091

#6523

Relation Also Knows: Rethinking the Recall and Editing of Factual Associations in Auto-Regressive Transformer Language Models

Xiyu Liu, Zhengxiao Liu, Naibin Gu et al.

NEURIPS 2025arXiv:2507.02861

#6524

LiteReality: Graphic-Ready 3D Scene Reconstruction from RGB-D Scans

Zhening Huang, Xiaoyang Wu, Fangcheng Zhong et al.

ICCV 2025arXiv:2506.22799

#6525

VoteSplat: Hough Voting Gaussian Splatting for 3D Scene Understanding

Minchao Jiang, Shunyu Jia, Jiaming Gu et al.

NEURIPS 2025oralarXiv:2507.09082

#6526

Taming generative video models for zero-shot optical flow extraction

Seungwoo Kim, Khai Loong Aw, Klemen Kotar et al.

CVPR 2025arXiv:2404.00916

#6527

Gyro-based Neural Single Image Deblurring

Heemin Yang, Jaesung Rim, Seungyong Lee et al.

CVPR 2025arXiv:2411.14762

#6528

Efficient Long Video Tokenization via Coordinate-based Patch Reconstruction

Huiwon Jang, Sihyun Yu, Jinwoo Shin et al.

NEURIPS 2025arXiv:2507.05604

#6529

Kernel Density Steering: Inference-Time Scaling via Mode Seeking for Image Restoration

Yuyang Hu, Kangfu Mei, Mojtaba Ardakani et al.

NEURIPS 2025arXiv:2504.14119

#6530

CodeCrash: Exposing LLM Fragility to Misleading Natural Language in Code Reasoning

Man Ho Lam, Chaozheng Wang, Jen-Tse Huang et al.

ICCV 2025arXiv:2508.05689

#6531

Boosting Adversarial Transferability via Residual Perturbation Attack

Jinjia Peng, Zeze Tao, Huibing Wang et al.

#6532

LOD-GS: Achieving Levels of Detail using Scalable Gaussian Soup

Jianxiong Shen, Yue Qian, Xiaohang Zhan

CVPR 2025arXiv:2503.10597

#6533

GroomLight: Hybrid Inverse Rendering for Relightable Human Hair Appearance Modeling

Yang Zheng, Menglei Chai, Delio Vicini et al.

CVPR 2025highlightarXiv:2503.08306

#6534

Reasoning in Visual Navigation of End-to-end Trained Agents: A Dynamical Systems Approach

Steeven JANNY, Hervé Poirier, Leonid Antsfeld et al.

CVPR 2025arXiv:2505.13788

#6535

Ground-V: Teaching VLMs to Ground Complex Instructions in Pixels

Yongshuo Zong, Qin ZHANG, DONGSHENG An et al.

CVPR 2025arXiv:2506.03512

#6536

EDCFlow: Exploring Temporally Dense Difference Maps for Event-based Optical Flow Estimation

Daikun Liu, Lei Cheng, Teng Wang et al.

CVPR 2025arXiv:2506.05890

#6537

Unleashing the Potential of Consistency Learning for Detecting and Grounding Multi-Modal Media Manipulation

Yiheng Li, Yang Yang, Zichang Tan et al.

NEURIPS 2025arXiv:2502.15609

#6538

On the Robustness of Transformers against Context Hijacking for Linear Classification

Tianle Li, Chenyang Zhang, Xingwu Chen et al.

NEURIPS 2025arXiv:2509.16456

#6539

GPO: Learning from Critical Steps to Improve LLM Reasoning

Jiahao Yu, Zelei Cheng, Xian Wu et al.

NEURIPS 2025arXiv:2505.14884

#6540

Polar Sparsity: High Throughput Batched LLM Inferencing with Scalable Contextual Sparsity

Susav Shrestha, Bradley Settlemyer, Nikoli Dryden et al.

NEURIPS 2025arXiv:2505.20268

#6541

Outcome-Based Online Reinforcement Learning: Algorithms and Fundamental Limits

Fan Chen, Zeyu Jia, Alexander Rakhlin et al.

NEURIPS 2025spotlightarXiv:2506.01320

#6542

$\Psi$-Sampler: Initial Particle Sampling for SMC-Based Inference-Time Reward Alignment in Score Models

Taehoon Yoon, Yunhong Min, Kyeongmin Yeo et al.

NEURIPS 2025arXiv:2507.02843

#6543

LLM-Driven Treatment Effect Estimation Under Inference Time Text Confounding

Yuchen Ma, Dennis Frauen, Jonas Schweisthal et al.

NEURIPS 2025oralarXiv:2510.03578

#6544

Latent Mixture of Symmetries for Sample-Efficient Dynamic Learning

Haoran Li, CHENHAN XIAO, Muhao Guo et al.

#6545

Parameterized Blur Kernel Prior Learning for Local Motion Deblurring

Zhenxuan Fang, Fangfang Wu, Tao Huang et al.

NEURIPS 2025arXiv:2501.17356

#6546

On the Coexistence and Ensembling of Watermarks

Aleksandar Petrov, Shruti Agarwal, Philip Torr et al.

NEURIPS 2025arXiv:2505.13344

#6547

RoPECraft: Training-Free Motion Transfer with Trajectory-Guided RoPE Optimization on Diffusion Transformers

Ahmet Berke Gökmen, Yiğit Ekin, Bahri Batuhan Bilecen et al.

CVPR 2025arXiv:2503.19232

#6548

HoGS: Unified Near and Far Object Reconstruction via Homogeneous Gaussian Splatting

Xinpeng Liu, Zeyi Huang, Fumio Okura et al.

CVPR 2025arXiv:2502.19937

#6549

Image Referenced Sketch Colorization Based on Animation Creation Workflow

Dingkun Yan, Xinrui Wang, Zhuoru Li et al.

CVPR 2025arXiv:2505.03116

#6550

TimeTracker: Event-based Continuous Point Tracking for Video Frame Interpolation with Non-linear Motion

Haoyue Liu, Jinghan Xu, Yi Chang et al.

CVPR 2025arXiv:2502.21130

#6551

Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning

Jiuyang Dong, Junjun Jiang, Kui Jiang et al.

NEURIPS 2025arXiv:2506.07555

#6552

Synthesize Privacy-Preserving High-Resolution Images via Private Textual Intermediaries

Haoxiang Wang, Zinan Lin, Da Yu et al.

CVPR 2025arXiv:2506.10286

#6553

HalLoc: Token-level Localization of Hallucinations for Vision Language Models

Eunkyu Park, Minyeong Kim, Gunhee Kim

#6554

UNICL-SAM: Uncertainty-Driven In-Context Segmentation with Part Prototype Discovery

Dianmo Sheng, Dongdong Chen, Zhentao Tan et al.

NEURIPS 2025arXiv:2505.13138

#6555

Neurosymbolic Diffusion Models

Emile van Krieken, Pasquale Minervini, Edoardo Maria Ponti et al.

CVPR 2025arXiv:2504.20468

#6556

Antidote: A Unified Framework for Mitigating LVLM Hallucinations in Counterfactual Presupposition and Object Perception

Yuanchen Wu, Lu Zhang, Hang Yao et al.

CVPR 2025arXiv:2506.03737

#6557

ComRoPE: Scalable and Robust Rotary Position Embedding Parameterized by Trainable Commuting Angle Matrices

Hao Yu, Tangyu Jiang, Shuning Jia et al.

NEURIPS 2025arXiv:2506.16406

#6558

Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights

Zhiyuan Liang, Dongwen Tang, Yuhao Zhou et al.

ICCV 2025arXiv:2411.17799

#6559

Signs as Tokens: A Retrieval-Enhanced Multilingual Sign Language Generator

Ronglai Zuo, Rolandos Alexandros Potamias, Evangelos Ververas et al.

NEURIPS 2025arXiv:2411.17265

#6560

Systematic Reward Gap Optimization for Mitigating VLM Hallucinations

Lehan He, Zeren Chen, Zhelun Shi et al.

NEURIPS 2025arXiv:2411.13029

#6561

Probably Approximately Precision and Recall Learning

Lee Cohen, Yishay Mansour, Shay Moran et al.

#6562

4D-Fly: Fast 4D Reconstruction from a Single Monocular Video

Diankun Wu, Fangfu Liu, Yi-Hsin Hung et al.

NEURIPS 2025arXiv:2503.14275

#6563

Free-Lunch Color-Texture Disentanglement for Stylized Image Generation

Jiang Qin, Alexandra Gomez-Villa, Senmao Li et al.

CVPR 2025arXiv:2503.19897

#6564

Scaling Down Text Encoders of Text-to-Image Diffusion Models

Lifu Wang, Daqing Liu, Xinchen Liu et al.

NEURIPS 2025arXiv:2505.24181

#6565

SCOUT: Teaching Pre-trained Language Models to Enhance Reasoning via Flow Chain-of-Thought

Guanghao Li, Wenhao Jiang, Mingfeng Chen et al.

CVPR 2025arXiv:2505.23290

#6566

Wav2Sem: Plug-and-Play Audio Semantic Decoupling for 3D Speech-Driven Facial Animation

Hao Li, Ju Dai, Xin Zhao et al.

#6567

Simpler Diffusion: 1.5 FID on ImageNet512 with Pixel-space Diffusion

Emiel Hoogeboom, Thomas Mensink, Jonathan Heek et al.

ICCV 2025highlightarXiv:2502.07001

#6568

From Image to Video: An Empirical Study of Diffusion Representations

Pedro Vélez, Luisa Polania Cabrera, Yi Yang et al.

#6569

Your Scale Factors are My Weapon: Targeted Bit-Flip Attacks on Vision Transformers via Scale Factor Manipulation

Jialai Wang, Yuxiao Wu, Weiye Xu et al.

NEURIPS 2025arXiv:2506.04224

#6570

Seeing in the Dark: Benchmarking Egocentric 3D Vision with the Oxford Day-and-Night Dataset

Zirui Wang, Wenjing Bian, Xinghui Li et al.

NEURIPS 2025spotlightarXiv:2505.15293

#6571

LLM-Explorer: A Plug-in Reinforcement Learning Policy Exploration Enhancement Driven by Large Language Models

Qianyue Hao, Yiwen Song, Qingmin Liao et al.

NEURIPS 2025arXiv:2506.07899

#6572

MEMOIR: Lifelong Model Editing with Minimal Overwrite and Informed Retention for LLMs

Ke Wang, Yiming QIN, Nikolaos Dimitriadis et al.

#6573

FFR: Frequency Feature Rectification for Weakly Supervised Semantic Segmentation

Ziqian Yang, Xinqiao Zhao, Xiaolei Wang et al.

#6574

Action Detail Matters: Refining Video Recognition with Local Action Queries

Mengmeng Wang, Zeyi Huang, Xiangjie Kong et al.

CVPR 2025arXiv:2412.11423

#6575

Nearly Zero-Cost Protection Against Mimicry by Personalized Diffusion Models

Namhyuk Ahn, KiYoon Yoo, Wonhyuk Ahn et al.

NEURIPS 2025arXiv:2505.20738

#6576

Silencer: From Discovery to Mitigation of Self-Bias in LLM-as-Benchmark-Generator

Peiwen Yuan, Yiwei Li, Shaoxiong Feng et al.

NEURIPS 2025arXiv:2505.10838

#6577

LARGO: Latent Adversarial Reflection through Gradient Optimization for Jailbreaking LLMs

Ran Li, Hao Wang, Chengzhi Mao

NEURIPS 2025arXiv:2505.13104

#6578

A Unified Framework for the Transportability of Population-Level Causal Measures

Ahmed Boughdiri, Clément Berenfeld, Julie Josse et al.

#6579

DFM: Differentiable Feature Matching for Anomaly Detection

Wu Sheng, Yimi Wang, Xudong Liu et al.

ICCV 2025arXiv:2503.17044

#6580

ExCap3D: Expressive 3D Scene Understanding via Object Captioning with Varying Detail

Chandan Yeshwanth, David Rozenberszki, Angela Dai

NEURIPS 2025arXiv:2505.19406

#6581

Unveiling the Compositional Ability Gap in Vision-Language Reasoning Model

Tianle Li, Jihai Zhang, Yongming Rao et al.

NEURIPS 2025arXiv:2506.04598

#6582

Scaling Laws for Robust Comparison of Open Foundation Language-Vision Models and Datasets

Marianna Nezhurina, Tomer Porian, Giovanni Puccetti et al.

CVPR 2025arXiv:2406.05704

#6583

Hierarchical Features Matter: A Deep Exploration of Progressive Parameterization Method for Dataset Distillation

Xinhao Zhong, Hao Fang, Bin Chen et al.

CVPR 2025arXiv:2506.07857

#6584

LogoSP: Local-global Grouping of Superpoints for Unsupervised Semantic Segmentation of 3D Point Clouds

Zihui Zhang, Weisheng Dai, Hongtao Wen et al.

#6585

PS-Diffusion: Photorealistic Subject-Driven Image Editing with Disentangled Control and Attention

Weicheng Wang, Guoli Jia, Zhongqi Zhang et al.

NEURIPS 2025arXiv:2512.06963

#6586

VideoVLA: Video Generators Can Be Generalizable Robot Manipulators

Yichao Shen, Fangyun Wei, Zhiying Du et al.

NEURIPS 2025arXiv:2504.09702

#6587

MLRC-Bench: Can Language Agents Solve Machine Learning Research Challenges?

Yunxiang Zhang, Muhammad Khalifa, Shitanshu Bhushan et al.

CVPR 2025arXiv:2412.03178

#6588

Towards Understanding and Quantifying Uncertainty for Text-to-Image Generation

Gianni Franchi, Nacim Belkhir, Dat NGUYEN et al.

CVPR 2025highlightarXiv:2503.02745

#6589

ArcPro: Architectural Programs for Structured 3D Abstraction of Sparse Points

Qirui Huang, Runze Zhang, Kangjun Liu et al.

NEURIPS 2025oralarXiv:2506.05259

#6590

Learning long range dependencies through time reversal symmetry breaking

Guillaume Pourcel, Maxence Ernoult

NEURIPS 2025arXiv:2412.05718

#6591

RLZero: Direct Policy Inference from Language Without In-Domain Supervision

Harshit Sushil Sikchi, Siddhant Agarwal, Pranaya Jajoo et al.

ICCV 2025arXiv:2411.16789

#6592

Leveraging the Power of MLLMs for Gloss-Free Sign Language Translation

Jungeun Kim, Hyeongwoo Jeon, Jongseong Bae et al.

#6593

FeedEdit: Text-Based Image Editing with Dynamic Feedback Regulation

Fengyi Fu, Lei Zhang, Mengqi Huang et al.

NEURIPS 2025oralarXiv:2505.12053

#6594

VFRTok: Variable Frame Rates Video Tokenizer with Duration-Proportional Information Assumption

Tianxiong Zhong, Xingye Tian, Boyuan Jiang et al.

CVPR 2025arXiv:2411.17332

#6595

On the Generalization of Handwritten Text Recognition Models

Carlos Garrido-Munoz, Jorge Calvo-Zaragoza

NEURIPS 2025arXiv:2509.23639

#6596

LightFair: Towards an Efficient Alternative for Fair T2I Diffusion via Debiasing Pre-trained Text Encoders

Boyu Han, Qianqian Xu, Shilong Bao et al.

CVPR 2025arXiv:2503.04829

#6597

StickMotion: Generating 3D Human Motions by Drawing a Stickman

Tao Wang, Zhihua Wu, Qiaozhi He et al.

NEURIPS 2025arXiv:2502.13119

#6598

STEER-ME: Assessing the Microeconomic Reasoning of Large Language Models

Narun Raman, Taylor Lundy, Thiago Amin et al.

NEURIPS 2025arXiv:2511.07378

#6599

Transformers Provably Learn Chain-of-Thought Reasoning with Length Generalization

Yu Huang, Zixin Wen, Aarti Singh et al.

#6600

MVGBench: a Comprehensive Benchmark for Multi-view Generation Models

Xianghui Xie, Jan Lenssen, Gerard Pons-Moll

ICCV 2025