Most Cited 2025 &quot;6-dof manipulation&quot; Papers

ICCV 2025posterarXiv:2412.06779

#21804

AnyBimanual: Transferring Unimanual Policy for General Bimanual Manipulation

Guanxing Lu, Tengbo Yu, Haoyuan Deng et al.

#21805

FVGen: Accelerating Novel-View Synthesis with Adversarial Video Diffusion Distillation

Wenbin Teng, Gonglin Chen, Haiwei Chen et al.

ICCV 2025posterarXiv:2508.06392

#21806

CoralSRT: Revisiting Coral Reef Semantic Segmentation by Feature Rectifying via Self-supervised Guidance

Zheng Ziqiang, Wong Kwan, Binh-Son Hua et al.

ICCV 2025posterarXiv:2507.00392

#21807

Learning Dense Feature Matching via Lifting Single 2D Image to 3D Space

Yingping Liang, Yutao Hu, Wenqi Shao et al.

#21808

Diagnosing Pretrained Models for Out-of-distribution Detection

Haipeng Xiong, Kai Xu, Angela Yao

ICCV 2025posterarXiv:2505.22129

#21809

What Makes for Text to 360-degree Panorama Generation with Stable Diffusion?

Jinhong Ni, Chang-Bin Zhang, Qiang Zhang et al.

#21810

Learning Normals of Noisy Points by Local Gradient-Aware Surface Filtering

Qing Li, Huifang Feng, Xun Gong et al.

ICCV 2025posterarXiv:2507.03394

#21811

TSENOR: Highly-Efficient Algorithm for Finding Transposable N:M Sparse Masks

Xiang Meng, Mehdi Makni, Rahul Mazumder

#21812

Bayesian-Inspired Space-Time Superpixels

Kent Gauen, Stanley Chan

ICCV 2025posterarXiv:2509.23700

#21813

INSTINCT: Instance-Level Interaction Architecture for Query-Based Collaborative Perception

yunjiang xu, Yupeng Ouyang, Lingzhi Li et al.

#21814

Debiased Curriculum Adaptation for Safe Transfer Learning in Chest X-ray Classification

Mingyang Liu, Xinyang Chen, Yang Shu et al.

ICCV 2025posterarXiv:2507.14826

#21815

PHATNet: A Physics-guided Haze Transfer Network for Domain-adaptive Real-world Image Dehazing

Fu-Jen Tsai, Yan-Tsung Peng, Yen-Yu Lin et al.

#21816

Forensic-MoE: Exploring Comprehensive Synthetic Image Detection Traces with Mixture of Experts

Mingqi Fang, Ziguang Li, Lingyun Yu et al.

ICCV 2025posterarXiv:2507.03504

#21817

Information-Bottleneck Driven Binary Neural Network for Change Detection

Kaijie Yin, Zhiyuan Zhang, Shu Kong et al.

#21818

Entropy-Adaptive Diffusion Policy Optimization with Dynamic Step Alignment

Renye Yan, Jikang Cheng, Yaozhong Gan et al.

ICCV 2025posterarXiv:2504.05623

#21819

Time-Aware Auto White Balance in Mobile Photography

Mahmoud Afifi, Luxi Zhao, Abhijith Punnappurath et al.

#21820

Leveraging Panoptic Scene Graph for Evaluating Fine-Grained Text-to-Image Generation

Xueqing Deng, Linjie Yang, Qihang Yu et al.

ICCV 2025posterarXiv:2507.11261

#21821

ViewSRD: 3D Visual Grounding via Structured Multi-View Decomposition

Ronggang Huang, Haoxin Yang, Yan Cai et al.

#21822

Physical Degradation Model-Guided Interferometric Hyperspectral Reconstruction with Unfolding Transformer

Yuansheng Li, Yunhao Zou, Linwei Chen et al.

ICCV 2025posterarXiv:2506.21880

#21823

VPR-Cloak: A First Look at Privacy Cloak Against Visual Place Recognition

Shuting Dong, Mingzhi Chen, Feng Lu et al.

#21824

Weak-for-Strong: Training Weak Meta-Agent to Harness Strong Executors

Fan Nie, Lan Feng, Haotian Ye et al.

ICCV 2025posterarXiv:2505.03351

#21825

GUAVA: Generalizable Upper Body 3D Gaussian Avatar

Dongbin Zhang, Yunfei Liu, Lijian Lin et al.

#21826

HOMO-Feature: Cross-Arbitrary-Modal Image Matching with Homomorphism of Organized Major Orientation

Chenzhong Gao, Wei Li, Desheng Weng

ICCV 2025posterarXiv:2412.02129

#21827

GSOT3D: Towards Generic 3D Single Object Tracking in the Wild

Yifan Jiao, Yunhao Li, Junhua Ding et al.

#21828

Locally Optimal Private Sampling: Beyond the Global Minimax

Hrad Ghoukasian, Bonwoo Lee, Shahab Asoodeh

NEURIPS 2025posterarXiv:2510.09485

#21829

Dynamic-DINO: Fine-Grained Mixture of Experts Tuning for Real-time Open-Vocabulary Object Detection

Yehao Lu, Minghe Weng, Zekang Xiao et al.

ICCV 2025posterarXiv:2507.17436

#21830

WAVE: Warp-Based View Guidance for Consistent Novel View Synthesis Using a Single Image

Jiwoo Park, Tae Choi, Youngjun Jun et al.

ICCV 2025posterarXiv:2506.23518

#21831

DEGauss: Defending Against Malicious 3D Editing for Gaussian Splatting

Lingzhuang Meng, Mingwen Shao, Yuanjian Qiao et al.

#21832

Scalable Signature Kernel Computations via Local Neumann Series Expansions

Matthew Tamayo-Rios, Alexander Schell, Rima Alaifari

ICCV 2025posterarXiv:2508.16121

#21833

Lightweight and Fast Real-time Image Enhancement via Decomposition of the Spatial-aware Lookup Tables

Wontae Kim, Keuntek Lee, Nam Ik Cho

#21834

Quantifying and Alleviating Co-Adaptation in Sparse-View 3D Gaussian Splatting

Kangjie Chen, Yingji Zhong, Zhihao Li et al.

NEURIPS 2025posterarXiv:2508.12720

#21835

Impact of LLM Alignment on Impression Formation in Social Interactions

Ala N. Tak, Anahita Bolourani, Daniel B. Shank et al.

ICCV 2025posterarXiv:2507.23162

#21836

Neural Multi-View Self-Calibrated Photometric Stereo without Photometric Stereo Cues

Xu Cao, Takafumi Taketomi

#21837

Enhancing the Maximum Effective Window for Long-Term Time Series Forecasting

Jiahui Zhang, Zhengyang Zhou, Wenjie Du et al.

ICCV 2025posterarXiv:2407.21735

#21838

EMatch: A Unified Framework for Event-based Optical Flow and Stereo Matching

Pengjie Zhang, Lin Zhu, Xiao Wang et al.

#21839

Where Does It Exist from the Low-Altitude: Spatial Aerial Video Grounding

Yang Zhan, Yuan Yuan

NEURIPS 2025oral

#21840

NoWag: A Unified Framework for Shape Preserving Com- pression of Large Language Models

Lawrence Ray Liu, Inesh Chakrabarti, Yixiao Li et al.

NEURIPS 2025posterarXiv:2505.23049

#21841

DenoiseRotator: Enhance Pruning Robustness for LLMs via Importance Concentration

Tianteng Gu, Bei Liu, Bo Xiao et al.

#21842

CounterPC: Counterfactual Feature Realignment for Unsupervised Domain Adaptation on Point Clouds

Feng Yang, Yichao Cao, Xiu Su et al.

ICCV 2025highlight

#21843

KScope: A Framework for Characterizing the Knowledge Status of Language Models

Yuxin Xiao, Shan Chen, Jack Gallifant et al.

NEURIPS 2025posterarXiv:2506.07458

#21844

Liberated-GS: 3D Gaussian Splatting Independent from SfM Point Clouds

Weihong Pan, Xiaoyu Zhang, Hongjia Zhai et al.

ICCV 2025posterarXiv:2508.08556

#21845

Unlocking the Potential of Diffusion Priors in Blind Face Restoration

Yunqi Miao, Zhiyu Qu, Mingqi Gao et al.

#21846

Beyond Node-Centric Modeling: Sketching Signed Networks with Simplicial Complexes

Wei Wu, Xuan Tan, Yan Peng et al.

ICCV 2025posterarXiv:2507.20740

#21847

Implicit Counterfactual Learning for Audio-Visual Segmentation

Mingfeng Zha, Tianyu Li, Guoqing Wang et al.

#21848

Train on Pins and Test on Obstacles for Rectilinear Steiner Minimum Tree

Xingbo Du, Ruizhe Zhong, Junchi Yan

ICCV 2025posterarXiv:2504.06504

#21849

STaR: Seamless Spatial-Temporal Aware Motion Retargeting with Penetration and Consistency Constraints

Xiaohang Yang, Qing Wang, Jiahao Yang et al.

#21850

MRGen: Segmentation Data Engine For Underrepresented MRI Modalities

Haoning Wu, Ziheng Zhao, Ya Zhang et al.

ICCV 2025posterarXiv:2412.04106

#21851

Towards Reliable LLM-based Robots Planning via Combined Uncertainty Estimation

Shiyuan Yin, Chenjia Bai, Zihao Zhang et al.

NEURIPS 2025posterarXiv:2510.08044

#21852

Lifelong Test-Time Adaptation via Online Learning in Tracked Low-Dimensional Subspace

Dexin Duan, Rui Xu, Peilin Liu et al.

ICCV 2025posterarXiv:2506.20983

#21853

Rethink Sparse Signals for Pose-guided Text-to-image Generation

Wenjie Xuan, Jing Zhang, Juhua Liu et al.

#21854

Does Object Binding Naturally Emerge in Large Pretrained Vision Transformers?

Yihao Li, Saeed Salehi, Lyle Ungar et al.

NEURIPS 2025spotlightarXiv:2510.24709

#21855

Single-Scanline Relative Pose Estimation for Rolling Shutter Cameras

Petr Hruby, Marc Pollefeys

ICCV 2025posterarXiv:2506.22069

#21856

Enhancing Transferability of Targeted Adversarial Examples via Inverse Target Gradient Competition and Spatial Distance Stretching

Zhankai Li, Weiping Wang, jie li et al.

#21857

LDPose: Towards Inclusive Human Pose Estimation for Limb-Deficient Individuals in the Wild

Jiaying Ying, Heming Du, Kaihao Zhang et al.

ICCV 2025posterarXiv:2503.11576

#21858

SmolDocling: An ultra-compact vision-language model for end-to-end multi-modal document conversion

Ahmed Nassar, Matteo Omenetti, Maksym Lysak et al.

#21859

Images as Noisy Labels: Unleashing the Potential of the Diffusion Model for Open-Vocabulary Semantic Segmentation

Fan Li, Xuanbin Wang, Xuan Wang et al.

ICCV 2025highlight

#21860

ContextFace: Generating Facial Expressions from Emotional Contexts

minjung kim, Minsang Kim, Seung Jun Baek

#21861

SMP-Attack: Boosting the Transferability of Feature Importance-based Adversarial Attack with Semantics-aware Multi-granularity Patchout

Wen Yang, Guodong Liu, Di Ming

#21862

Spatial-Temporal Forgery Trace based Forgery Image Identification

Yilin Wang, Zunlei Feng, Jiachi Wang et al.

#21863

Towards Annotation-Free Evaluation: KPAScore for Human Keypoint Detection

Xiaoxiao Wang, Chunxiao Li, Peng Sun et al.

ICCV 2025posterarXiv:2510.13419

#21864

Ultra High-Resolution Image Inpainting with Patch-Based Content Consistency Adapter

JianHui Zhang, Shen Cheng, Qirui Sun et al.

#21865

Agreement aware and dissimilarity oriented GLOM

Ru Zeng, Yan Song, Yang ZHANG et al.

NEURIPS 2025posterarXiv:2512.23858

#21866

Yggdrasil: Bridging Dynamic Speculation and Static Runtime for Latency-Optimal Tree-Based LLM Decoding

Yue Guan, Changming Yu, Shihan Fang et al.

#21867

MeasureXpert: Automatic Anthropometric Measurement Extraction from Two Unregistered, Partial, Posed, and Dressed Body Scans

Ran Zhao, Xinxin Dai, Pengpeng Hu et al.

ICCV 2025posterarXiv:2506.21237

#21868

DiMPLe - Disentangled Multi-Modal Prompt Learning: Enhancing Out-Of-Distribution Alignment with Invariant and Spurious Feature Separation

Umaima Rahman, Mohammad Yaqub, Dwarikanath Mahapatra

#21869

ResidualViT for Efficient Temporally Dense Video Encoding

Mattia Soldan, Fabian Caba Heilbron, Bernard Ghanem et al.

ICCV 2025highlightarXiv:2509.13255

#21870

Puppet-Master: Scaling Interactive Video Generation as a Motion Prior for Part-Level Dynamics

Ruining Li, Chuanxia Zheng, Christian Rupprecht et al.

ICCV 2025posterarXiv:2408.04631

#21871

Randomized Autoregressive Visual Generation

Qihang Yu, Ju He, Xueqing Deng et al.

ICCV 2025posterarXiv:2411.00776

#21872

Unsupervised RGB-D Point Cloud Registration for Scenes with Low Overlap and Photometric Inconsistency

yejun Shou, Haocheng Wang, Lingfeng Shen et al.

ICCV 2025posterarXiv:2506.09445

#21873

TOGA: Temporally Grounded Open-Ended Video QA with Weak Supervision

Ayush Gupta, Anirban Roy, Rama Chellappa et al.

#21874

Restricted Global-Aware Graph Filters Bridging GNNs and Transformer for Node Classification

Jingyuan Zhang, Xin Wang, Lei Yu et al.

#21875

A Beyond-Worst-Case Analysis of Greedy k-means++

Qingyun Chen, Sungjin Im, Ben Moseley et al.

#21876

Beyond Blanket Masking: Examining Granularity for Privacy Protection in Images Captured by Blind and Low Vision Users

Jeffri Murrugarra-Llerena, Haoran Niu, K. Suzanne Barber et al.

ICCV 2025posterarXiv:2507.23300

#21877

Training-free Geometric Image Editing on Diffusion Models

Hanshen Zhu, Zhen Zhu, Kaile Zhang et al.

#21878

BlurDM: A Blur Diffusion Model for Image Deblurring

Jin-Ting He, Fu-Jen Tsai, Yan-Tsung Peng et al.

NEURIPS 2025posterarXiv:2512.03979

#21879

Monocular Facial Appearance Capture in the Wild

Yingyan Xu, Kate Gadola, Prashanth Chandran et al.

ICCV 2025posterarXiv:2412.12765

#21880

Growing a Twig to Accelerate Large Vision-Language Models

Zhenwei Shao, Mingyang Wang, Zhou Yu et al.

ICCV 2025posterarXiv:2503.14075

#21881

SignRep: Enhancing Self-Supervised Sign Representations

Ryan Wong, Necati Cihan Camgoz, Richard Bowden

ICCV 2025posterarXiv:2503.08529

#21882

MixA: A Mixed Attention approach with Stable Lightweight Linear Attention to enhance Efficiency of Vision Transformers at the Edge

Sabbir Ahmed, Jingtao Li, Weiming Zhuang et al.

#21883

Nearly-Linear Time and Massively Parallel Algorithms for $k$-anonymity

Kevin Aydin, Honghao Lin, David Woodruff et al.

ICCV 2025posterarXiv:2412.02592

#21884

What do you know? Bayesian knowledge inference for navigating agents

Matthias Schultheis, Jana-Sophie Schönfeld, Constantin Rothkopf et al.

NEURIPS 2025oral

#21885

OCR Hinders RAG: Evaluating the Cascading Impact of OCR on Retrieval-Augmented Generation

Junyuan Zhang, Qintong Zhang, Bin Wang et al.

#21886

Efficient Event Camera Data Pretraining with Adaptive Prompt Fusion

Quanmin Liang, Qiang Li, Shuai Liu et al.

#21887

Head2Body: Body Pose Generation from Multi-sensory Head-mounted Inputs

Minh Tran, Hongda Mao, Qingshuang Chen et al.

ICCV 2025posterarXiv:2509.16822

#21888

Looking in the Mirror: A Faithful Counterfactual Explanation Method for Interpreting Deep Image Classification Models

Townim Chowdhury, Vu Phan, Kewen Liao et al.

#21889

FLSeg: Enhancing Privacy and Robustness in Federated Learning under Heterogeneous Data via Model Segmentation

Zichun Su, Zhi Lu, Yutong Wu et al.

#21890

Self-Calibrating Gaussian Splatting for Large Field-of-View Reconstruction

Youming Deng, Wenqi Xian, Guandao Yang et al.

ICCV 2025highlight

#21891

Gradient Decomposition and Alignment for Incremental Object Detection

Wenlong Luo, Shizhou Zhang, De Cheng et al.

ICCV 2025posterarXiv:2507.22349

#21892

MSQ: Memory-Efficient Bit Sparsification Quantization

Seokho Han, Seoyeon Yoon, Jinhee Kim et al.

#21893

ShapeCraft: LLM Agents for Structured, Textured and Interactive 3D Modeling

Shuyuan Zhang, ChenHan Jiang, Zuoou Li et al.

NEURIPS 2025posterarXiv:2510.17603

#21894

Gate to the Vessel: Residual Experts Restore What SAM Overlooks

Weili Jiang, Jinrong Lv, Xun Gong et al.

ICCV 2025posterarXiv:2507.10578

#21895

When and Where do Data Poisons Attack Textual Inversion?

Jeremy Styborski, Mingzhi Lyu, Jiayou Lu et al.

#21896

TrajMamba: An Efficient and Semantic-rich Vehicle Trajectory Pre-training Model

Yichen Liu, Yan Lin, Shengnan Guo et al.

NEURIPS 2025spotlightarXiv:2510.17545

#21897

SRefiner: Soft-Braid Attention for Multi-Agent Trajectory Refinement

Liwen Xiao, Zhiyu Pan, Zhicheng Wang et al.

ICCV 2025highlightarXiv:2507.04263

#21898

Spike-RetinexFormer: Rethinking Low-light Image Enhancement with Spiking Neural Networks

Hongzhi Wang, Xiubo Liang, Jinxing Han et al.

ICCV 2025posterarXiv:2507.20834

#21899

Rethinking Few Shot CLIP Benchmarks: A Critical Analysis in the Inductive Setting

Alexey Kravets, Da Chen, Vinay Namboodiri

#21900

HiMoLE: Towards OOD-Robust LoRA via Hierarchical Mixture of Experts

Yinuo Jiang, Yan Xiaodong, Keyan Ding et al.

ICCV 2025posterarXiv:2507.12001

#21901

AU-Blendshape for Fine-grained Stylized 3D Facial Expression Manipulation

Hao Li, Ju Dai, Feng Zhou et al.

#21902

BokehDiff: Neural Lens Blur with One-Step Diffusion

Chengxuan Zhu, Qingnan Fan, Qi Zhang et al.

ICCV 2025posterarXiv:2507.18060

#21903

Vision as a Dialect: Unifying Visual Understanding and Generation via Text-Aligned Representations

Jiaming Han, Hao Chen, Yang Zhao et al.

NEURIPS 2025posterarXiv:2506.18898

#21904

Trial-Oriented Visual Rearrangement

Yuyi Liu, Xinhang Song, Tianliang Qi et al.

#21905

Debiased Teacher for Day-to-Night Domain Adaptive Object Detection

Yiming Cui, Liang Li, Haibing YIN et al.

ICCV 2025posterarXiv:2501.14484

#21906

SpikePack: Enhanced Information Flow in Spiking Neural Networks with High Hardware Compatibility

Guobin Shen, Jindong Li, Tenglong Li et al.

#21907

Social Debiasing for Fair Multi-modal LLMs

Harry Cheng, Yangyang Guo, Qingpei Guo et al.

ICCV 2025posterarXiv:2408.06569

#21908

Hierarchy-Aware Pseudo Word Learning with Text Adaptation for Zero-Shot Composed Image Retrieval

Zhe Li, Lei Zhang, Zheren Fu et al.

NEURIPS 2025posterarXiv:2410.01623

#21909

Fira: Can We Achieve Full-rank Training of LLMs Under Low-rank Constraint?

Xi Chen, Kaituo Feng, Changsheng Li et al.

#21910

UPP: Unified Point-Level Prompting for Robust Point Cloud Analysis

Zixiang Ai, Zhenyu Cui, Yuxin Peng et al.

ICCV 2025posterarXiv:2507.18997

#21911

AV-Flow: Transforming Text to Audio-Visual Human-like Interactions

Aggelina Chatziagapi, Louis-Philippe Morency, Hongyu Gong et al.

ICCV 2025posterarXiv:2502.13133

#21912

Probabilistic Inertial Poser (ProbIP): Uncertainty-aware Human Motion Modeling from Sparse Inertial Sensors

Min Kim, Younho Jeon, Sungho Jo

#21913

Principled Model Routing for Unknown Mixtures of Source Domains

Christoph Dann, Yishay Mansour, Teodor Vanislavov Marinov et al.

ICCV 2025posterarXiv:2507.17373

#21914

SFUOD: Source-Free Unknown Object Detection

Keon-Hee Park, Seun-An Choe, Gyeong-Moon Park

#21915

Compression-Aware One-Step Diffusion Model for JPEG Artifact Removal

Jinpei Guo, Zheng Chen, Wenbo Li et al.

ICCV 2025posterarXiv:2502.09873

#21916

ConstStyle: Robust Domain Generalization with Unified Style Transformation

Nam Duong Tran, Nam Nguyen Phuong, Hieu Pham et al.

ICCV 2025posterarXiv:2509.05975

#21917

Golden Noise for Diffusion Models: A Learning Framework

zikai zhou, Shitong Shao, Lichen Bai et al.

ICCV 2025posterarXiv:2411.09502

#21918

Vision-Language Interactive Relation Mining for Open-Vocabulary Scene Graph Generation

Yukuan Min, Muli Yang, Jinhao Zhang et al.

ICCV 2025posterarXiv:2504.04801

#21919

OrderChain: Towards General Instruct-Tuning for Stimulating the Ordinal Understanding Ability of MLLM

Jinhong Wang, Shuo Tong, Jintai CHEN et al.

#21920

Unified Open-World Segmentation with Multi-Modal Prompts

Yang Liu, Yufei Yin, Chenchen Jing et al.

ICCV 2025posterarXiv:2510.10524

#21921

LayerAnimate: Layer-level Control for Animation

Yuxue Yang, Lue Fan, Zuzeng Lin et al.

ICCV 2025posterarXiv:2501.08295

#21922

Finite Sample Analysis of Linear Temporal Difference Learning with Arbitrary Features

Zixuan Xie, Xinyu Liu, Rohan Chandra et al.

NEURIPS 2025oralarXiv:2505.21391

#21923

Aligning by Misaligning: Boundary-aware Curriculum Learning for Multimodal Alignment

Hua Ye, Hang Ding, Siyuan Chen et al.

NEURIPS 2025posterarXiv:2511.08399

#21924

Distilling Diffusion Models to Efficient 3D LiDAR Scene Completion

shengyuan zhang, An Zhao, Ling Yang et al.

ICCV 2025posterarXiv:2412.03515

#21925

SuperEvent: Cross-Modal Learning of Event-based Keypoint Detection for SLAM

Yannick Burkhardt, Simon Schaefer, Stefan Leutenegger

ICCV 2025highlightarXiv:2504.00139

#21926

FedAGC: Federated Continual Learning with Asymmetric Gradient Correction

Chengchao Zhang, Fanhua Shang, Hongying Liu et al.

ICCV 2025posterarXiv:2510.04125

#21927

Joint Learning of Pose Regression and Denoising Diffusion with Score Scaling Sampling for Category-level 6D Pose Estimation

Seunghyun Lee, Tae-Kyun Kim

#21928

Intra-modal and Cross-modal Synchronization for Audio-visual Deepfake Detection and Temporal Localization

Ashutosh Anshul, Shreyas Gopal, Deepu Rajan et al.

NEURIPS 2025posterarXiv:2502.14334

#21929

Purest Quantum State Identification

Yingqi Yu, Honglin Chen, Jun Wu et al.

#21930

Quantization Hurts Reasoning? An Empirical Study on Quantized Reasoning Models

Ruikang Liu, Yuxuan Sun, Manyi Zhang et al.

#21931

MobileODE: An Extra Lightweight Network

Le Yu, Jun Wu, Bo Gou et al.

ICCV 2025posterarXiv:2502.20826

#21932

CoTMR: Chain-of-Thought Multi-Scale Reasoning for Training-Free Zero-Shot Composed Image Retrieval

Zelong Sun, Dong Jing, Zhiwu Lu

#21933

The Curse of Conditions: Analyzing and Improving Optimal Transport for Conditional Flow-Based Generation

Ho Kei Cheng, Alex Schwing

ICCV 2025posterarXiv:2503.10636

#21934

OmniTry: Virtual Try-On Anything without Masks

Yutong Feng, Linlin Zhang, Hengyuan Cao et al.

NEURIPS 2025posterarXiv:2508.13632

#21935

DepthSync: Diffusion Guidance-Based Depth Synchronization for Scale- and Geometry-Consistent Video Depth Estimation

Yue-Jiang Dong, Wang Zhao, Jiale Xu et al.

ICCV 2025posterarXiv:2507.01603

#21936

InfiniDreamer: Arbitrarily Long Human Motion Generation via Segment Score Distillation

Wenjie Zhuo, Fan Ma, Hehe Fan

ICCV 2025posterarXiv:2411.18303

#21937

Client2Vec: Improving Federated Learning by Distribution Shifts Aware Client Indexing

Yongxin Guo, Lin Wang, Xiaoying Tang et al.

ICCV 2025posterarXiv:2405.16233

#21938

Overfill: Two-Stage Models for Efficient Language Model Decoding

Woojeong Kim, Junxiong Wang, Jing Nathan Yan et al.

#21939

Instance-Level Video Depth in Groups Beyond Occlusions

Yuan Liang, Yang Zhou, Ziming Sun et al.

NEURIPS 2025posterarXiv:2403.00397

#21940

The Price of Opportunity Fairness in Matroid Allocation Problems

Rémi Castera, Felipe Garrido-Lucero, Patrick Loiseau et al.

#21941

Future-Aware Interaction Network For Motion Forecasting

Shijie Li, Chunyu Liu, Xun Xu et al.

ICCV 2025posterarXiv:2503.06565

#21942

DreamCube: RGB-D Panorama Generation via Multi-plane Synchronization

Yukun Huang, Yanning Zhou, Jianan Wang et al.

NEURIPS 2025posterarXiv:2502.07364

#21943

Effects of Dropout on Performance in Long-range Graph Learning Tasks

Jasraj Singh, Keyue Jiang, Brooks Paige et al.

#21944

Optical Model-Driven Sharpness Mapping for Autofocus in Small Depth-of-Field and Severe Defocus Scenarios

Chen-Liang Fan, Mingpei Cao, Chih-Chien Hung et al.

#21945

HyPiDecoder: Hybrid Pixel Decoder for Efficient Segmentation and Detection

Fengzhe Zhou, Humphrey Shi

#21946

Controlled Visual Hallucination via Thalamus-Driven Decoupling Network for Domain Adaptation of Black-Box Predictors

Yuwu Lu, Chunzhi Liu

ICCV 2025posterarXiv:2407.05311

#21947

MMAD: Multi-label Micro-Action Detection in Videos

Kun Li, pengyu Liu, Dan Guo et al.

#21948

Localist Topographic Expert Routing: A Barrel Cortex-Inspired Modular Network for Sensorimotor Processing

Tianfang Zhu, Dongli Hu, Jiandong Zhou et al.

NEURIPS 2025posterarXiv:2506.05410

#21949

Homogeneous Keys, Heterogeneous Values: Exploiting Local KV Cache Asymmetry for Long-Context LLMs

Wanyun Cui, Mingwei Xu

#21950

Omni-scene Perception-oriented Point Cloud Geometry Enhancement for Coordinate Quantization

Wang Liu, Wei Gao

NEURIPS 2025posterarXiv:2506.11343

#21951

From Replication to Redesign: Exploring Pairwise Comparisons for LLM-Based Peer Review

Yaohui Zhang, Haijing ZHANG, Wenlong Ji et al.

#21952

Auto-Regressive Transformation for Image Alignment

Kanggeon Lee, Soochahn Lee, Kyoung Mu Lee

ICCV 2025posterarXiv:2505.04864

#21953

Training-Free Industrial Defect Generation with Diffusion Models

Ruyi Xu, Yen-Tzu Chiu, Tai-I Chen et al.

ICCV 2025posterarXiv:2503.07389

#21954

TRCE: Towards Reliable Malicious Concept Erasure in Text-to-Image Diffusion Models

Ruidong Chen, honglin guo, Lanjun Wang et al.

#21955

Explainably Safe Reinforcement Learning

Sabine Rieder, Stefan Pranger, Debraj Chakraborty et al.

NEURIPS 2025oralarXiv:2510.17626

#21956

CaMiT: A Time-Aware Car Model Dataset for Classification and Generation

Frédéric Lin, Biruk Abere Ambaw, Adrian Popescu et al.

#21957

SYMPHONY: Synergistic Multi-agent Planning with Heterogeneous Language Model Assembly

Wei Zhu, Zhiwen Tang, Kun Yue

NEURIPS 2025posterarXiv:2601.22623

#21958

Reconstructing Heterogeneous Biomolecules via Hierarchical Gaussian Mixtures and Part Discovery

Shayan Shekarforoush, David Lindell, Marcus Brubaker et al.

NEURIPS 2025posterarXiv:2506.09063

#21959

Connectome-Based Modelling Reveals Orientation Maps in the Drosophila Optic Lobe

Jia Nuo Liew, Shenghan Lin, Bowen Chen et al.

NEURIPS 2025posterarXiv:2510.21055

#21960

Online Multi-Class Selection with Group Fairness Guarantee

Faraz Zargari, Hossein Jazi, Lyndon Hallett et al.

#21961

Majority of the Bests: Improving Best-of-N via Bootstrapping

Amin Rakhsha, Kanika Madan, Tianyu Zhang et al.

NEURIPS 2025posterarXiv:2511.18630

#21962

Orthogonal Contrastive Learning for Multi-Representation fMRI Analysis

Tony Yousefnezhad

NEURIPS 2025oral

#21963

No Object Is an Island: Enhancing 3D Semantic Segmentation Generalization with Diffusion Models

Fan Li, Xuan Wang, Xuanbin Wang et al.

NEURIPS 2025posterarXiv:2504.18428

#21964

PolyMath: Evaluating Mathematical Reasoning in Multilingual Contexts

Yiming Wang, Pei Zhang, Jialong Tang et al.

#21965

Learning Interestingness in Automated Mathematical Theory Formation

George Tsoukalas, Rahul Saha, Amitayush Thakur et al.

NEURIPS 2025spotlightarXiv:2511.14778

#21966

ChemX: A Collection of Chemistry Datasets for Benchmarking Automated Information Extraction

Anastasia Vepreva, Julia Razlivina, Mariia Eremeyeva et al.

NEURIPS 2025posterarXiv:2501.00321

#21967

OCRBench v2: An Improved Benchmark for Evaluating Large Multimodal Models on Visual Text Localization and Reasoning

Ling Fu, Zhebin Kuang, Jiajun Song et al.

#21968

A Learning-Augmented Approach to Online Allocation Problems

Ilan Cohen, Debmalya Panigrahi

NEURIPS 2025posterarXiv:2509.19672

#21969

Memory-Augmented Potential Field Theory: A Framework for Adaptive Control in Non-Convex Domains

Dongzhe Zheng, Wenjie Mei

#21970

Dr. RAW: Towards General High-Level Vision from RAW with Efficient Task Conditioning

Wenjun Huang, Ziteng Cui, Yinqiang Zheng et al.

#21971

Cognitive Predictive Processing: A Human-inspired Framework for Adaptive Exploration in Open-World Reinforcement Learning

boheng liu, Ziyu Li, Chenghua Duan et al.

NEURIPS 2025posterarXiv:2509.23135

#21972

Trust Region Reward Optimization and Proximal Inverse Reward Optimization Algorithm

Yang Chen, Menglin Zou, Jiaqi Zhang et al.

#21973

RankSEG-RMA: An Efficient Segmentation Algorithm via Reciprocal Moment Approximation

Zixun Wang, Ben Dai

NEURIPS 2025posterarXiv:2510.15362

#21974

Adaptive Sigmoid Clipping for Balancing the Direction–Magnitude Mismatch Trade-off in Differentially Private Learning

Faeze Moradi Kalarde, Ali Bereyhi, Ben Liang et al.

NEURIPS 2025oralarXiv:2510.21449

#21975

MoniTor: Exploiting Large Language Models with Instruction for Online Video Anomaly Detection

shengtian yang, Yue Feng, Yingshi Liu et al.

#21976

THD-BAR: Topology Hierarchical Derived Brain Autoregressive Modeling for EEG Generic Representations

Wenchao Yang, Weidong Yan, Wenkang Liu et al.

NEURIPS 2025oralarXiv:2511.13733

#21977

F-Adapter: Frequency-Adaptive Parameter-Efficient Fine-Tuning in Scientific Machine Learning

Hangwei Zhang, Chun Kang, Yan Wang et al.

NEURIPS 2025posterarXiv:2509.23173

#21978

Unsupervised Federated Graph Learning

Lele Fu, Tianchi Liao, Sheng Huang et al.

#21979

A Closer Look at Graph Transformers: Cross-Aggregation and Beyond

Jiaming Zhuo, Ziyi Ma, Yintong Lu et al.

NEURIPS 2025spotlight

#21980

HypoBootstrap: A Bootstrapping Framework for Inductive Reasoning

Si Chen, Yifei Li, Richong Zhang

#21981

Enhancing Consistency of Flow-Based Image Editing through Kalman Control

Haozhe Chi, Zhicheng Sun, Yang Jin et al.

#21982

Storyboard-guided Alignment for Fine-grained Video Action Recognition

Enqi Liu, Liyuan Pan, Yan Yang et al.

#21983

Local Curvature Descent: Squeezing More Curvature out of Standard and Polyak Gradient Descent

Peter Richtarik, Simone Maria Giancola, Dymitr Lubczyk et al.

NEURIPS 2025posterarXiv:2412.09043

#21984

DrivingRecon: Large 4D Gaussian Reconstruction Model For Autonomous Driving

Hao LU, Tianshuo Xu, Wenzhao Zheng et al.

#21985

Shapley-Based Data Valuation for Weighted $k$-Nearest Neighbors

Guangyi Zhang, Qiyu Liu, Aristides Gionis

NEURIPS 2025posterarXiv:2410.22366

#21986

One-Step is Enough: Sparse Autoencoders for Text-to-Image Diffusion Models

Viacheslav Surkov, Chris Wendler, Antonio Mari et al.

#21987

ReFeed: Multi-dimensional Summarization Refinement with Reflective Reasoning on Feedback

Taewon Yun, Jihwan Oh, Hyangsuk Min et al.

#21988

Diffusion-Guided Graph Data Augmentation

Maria Marrium, Arif Mahmood, Muhammad Haris Khan et al.

NEURIPS 2025oralarXiv:2506.12027

#21989

Constant Bit-size Transformers Are Turing Complete

Qian Li, Yuyi Wang

#21990

Navigating the MIL Trade-Off: Flexible Pooling for Whole Slide Image Classification

Hossein Jafarinia, Danial Hamdi, Amirhossein Alamdar et al.

NEURIPS 2025spotlightarXiv:2410.01969

#21991

Which Algorithms Have Tight Generalization Bounds?

Michael Gastpar, Ido Nachum, Jonathan Shafer et al.

#21992

RGB-Only Supervised Camera Parameter Optimization in Dynamic Scenes

Fang Li, Hao Zhang, Narendra Ahuja

NEURIPS 2025spotlightarXiv:2509.15123

#21993

Enhancing Privacy in Multimodal Federated Learning with Information Theory

Tianzhe Xiao, Yichen Li, Yining Qi et al.