Most Cited 2025 "space-to-object regression" Papers

22,274 papers found • Page 108 of 112

Filters:Most Cited 2025 space-to-object regression Clear all

Conference

AAAI 2025 (3,028)COLM 2025 (418)CVPR 2025 (2,873)ICCV 2025 (2,701)ICLR 2025 (3,827)ICML 2025 (3,340)ISMAR 2025 (229)NEURIPS 2025 (5,858)AAAI 2024 (2,289)CVPR 2024 (2,716)ECCV 2024 (2,387)ICLR 2024 (2,297)ICML 2024 (2,635)

Paper Type

poster (24,624)paper (8,558)oral (1,594)spotlight (1,421)highlight (975)

#21401

A Computational Framework for Modeling Emergence of Color Vision in the Human Brain

Atsunobu Kotani, Yi-Ren Ng

ICLR 2025posterarXiv:2408.16916

#21402

Unsupervised Multiple Kernel Learning for Graphs via Ordinality Preservation

Yan Sun, Stanley Kok

ICLR 2025poster

#21403

Leveraging Flatness to Improve Information-Theoretic Generalization Bounds for SGD

Ze Peng, Jian Zhang, Yisen Wang et al.

ICLR 2025posterarXiv:2601.01465

#21404

Flaws of ImageNet, Computer Vision's Favourite Dataset

Nikita Kisel, Illia Volkov, Kateřina Hanzelková et al.

ICLR 2025posterarXiv:2412.00076

#21405

Lossy Compression with Pretrained Diffusion Models

jeremy vonderfecht, Feng Liu

ICLR 2025posterarXiv:2501.09815

#21406

Highly Efficient Self-Adaptive Reward Shaping for Reinforcement Learning

Haozhe Ma, Zhengding Luo, Thanh Vinh Vo et al.

ICLR 2025posterarXiv:2408.03029

#21407

SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration

Jintao Zhang, Jia wei, Pengle Zhang et al.

ICLR 2025posterarXiv:2410.02367

#21408

PIN: Prolate Spheroidal Wave Function-based Implicit Neural Representations

Viraj Dhananjaya Bandara Jayasundara Jayasundara Mudiyanselage, Heng Zhao, Demetrio Labate et al.

ICLR 2025poster

#21409

DeMo: Deep Motion Field Consensus with Learnable Kernels for Two-view Correspondence Learning

Yifan Lu, Jiajun Le, Zizhuo Li et al.

AAAI 2025paper

#21410

Extendable and Iterative Structure Learning Strategy for Bayesian Networks

Hamid Kalantari, Russell Greiner, Pouria Ramazi

ICLR 2025poster

#21411

Transformers Provably Solve Parity Efficiently with Chain of Thought

Juno Kim, Taiji Suzuki

ICLR 2025posterarXiv:2410.08633

#21412

Generalized Behavior Learning from Diverse Demonstrations

Varshith Sreeramdass, Rohan Paleja, Letian Chen et al.

ICLR 2025poster

#21413

ILLUSION: Unveiling Truth with a Comprehensive Multi-Modal, Multi-Lingual Deepfake Dataset

Kartik Thakral, Rishabh Ranjan, Akanksha Singh et al.

ICLR 2025poster

#21414

RuAG: Learned-rule-augmented Generation for Large Language Models

Yudi Zhang, Pei Xiao, Lu Wang et al.

ICLR 2025posterarXiv:2411.03349

#21415

Improving Deep Regression with Tightness

Shihao Zhang, Yuguang Yan, Angela Yao

ICLR 2025posterarXiv:2502.09122

#21416

GSE: Group-wise Sparse and Explainable Adversarial Attacks

Shpresim Sadiku, Moritz Wagner, Sebastian Pokutta

ICLR 2025posterarXiv:2311.17434

#21417

The impact of allocation strategies in subset learning on the expressive power of neural networks

Ofir Schlisselberg, Ran Darshan

ICLR 2025posterarXiv:2502.06300

#21418

Wavelet Diffusion Neural Operator

Peiyan Hu, Rui Wang, Xiang Zheng et al.

ICLR 2025posterarXiv:2412.04833

#21419

VCR: A Task for Pixel-Level Complex Reasoning in Vision Language Models via Restoring Occluded Text

Tianyu Zhang, Suyuchen Wang, Lu Li et al.

ICLR 2025posterarXiv:2406.06462

#21420

OccProphet: Pushing the Efficiency Frontier of Camera-Only 4D Occupancy Forecasting with an Observer-Forecaster-Refiner Framework

Junliang Chen, Huaiyuan Xu, Yi Wang et al.

ICLR 2025oral

#21421

Agree to Disagree: Demystifying Homogeneous Deep Ensembles through Distributional Equivalence

Yipei Wang, Xiaoqian Wang

ICLR 2025poster

#21422

Discovering Clone Negatives via Adaptive Contrastive Learning for Image-Text Matching

Renjie Pan, Jihao Dong, Hua Yang

ICLR 2025poster

#21423

Mitigating Reward Over-Optimization in RLHF via Behavior-Supported Regularization

Juntao Dai, Taiye Chen, Yaodong Yang et al.

ICLR 2025posterarXiv:2503.18130

#21424

IterComp: Iterative Composition-Aware Feedback Learning from Model Gallery for Text-to-Image Generation

Xinchen Zhang, Ling Yang, Guohao Li et al.

ICLR 2025posterarXiv:2410.07171

#21425

Resolution Attack: Exploiting Image Compression to Deceive Deep Neural Networks

Wangjia Yu, Xiaomeng Fu, Qiao Li et al.

ICLR 2025poster

#21426

Walk the Talk? Measuring the Faithfulness of Large Language Model Explanations

Katie Matton, Robert Ness, John Guttag et al.

ICLR 2025posterarXiv:2504.14150

#21427

ProtPainter: Draw or Drag Protein via Topology-guided Diffusion

Zhengxi Lu, Shizhuo Cheng, Yuru Jiang et al.

ICLR 2025posterarXiv:2504.14274

#21428

Redefining the task of Bioactivity Prediction

Yanwen Huang, Bowen Gao, Yinjun JIA et al.

ICLR 2025poster

#21429

CtD: Composition through Decomposition in Emergent Communication

Boaz Carmeli, Ron Meir, Yonatan Belinkov

ICLR 2025posterarXiv:2601.10169

#21430

Revisit Micro-batch Clipping: Adaptive Data Pruning via Gradient Manipulation

Lun Wang

ICLR 2025posterarXiv:2408.16204

#21431

Model Risk-sensitive Offline Reinforcement Learning

Gwangpyo Yoo, Honguk Woo

ICLR 2025poster

#21432

Beyond Squared Error: Exploring Loss Design for Enhanced Training of Generative Flow Networks

Rui Hu, Yifan Zhang, Zhuoran Li et al.

ICLR 2025posterarXiv:2410.02596

#21433

Simple yet Effective Incomplete Multi-view Clustering: Similarity-level Imputation and Intra-view Hybrid-group Prototype Construction

Shengju Yu, Zhibin Dong, Siwei Wang et al.

ICLR 2025poster

#21434

UniCBE: An Uniformity-driven Comparing Based Evaluation Framework with Unified Multi-Objective Optimization

Peiwen Yuan, Shaoxiong Feng, Yiwei Li et al.

ICLR 2025posterarXiv:2502.11454

#21435

Personality Alignment of Large Language Models

Minjun Zhu, Yixuan Weng, Linyi Yang et al.

ICLR 2025oralarXiv:2408.11779

#21436

UniRestore3D: A Scalable Framework For General Shape Restoration

Yuang Wang, Yujian Zhang, Sida Peng et al.

ICLR 2025poster

#21437

Adversarially Robust Anomaly Detection through Spurious Negative Pair Mitigation

Hossein Mirzaei Sadeghlou, Mojtaba Nafez, Jafar Habibi et al.

ICLR 2025poster

#21438

From Your Block to Our Block: How to Find Shared Structure Between Stochastic Block Models over Multiple Graphs

Iiro Kumpulainen, Sebastian Dalleiger, Jilles Vreeken et al.

AAAI 2025paperarXiv:2412.15476

#21439

Disentangling, Amplifying, and Debiasing: Learning Disentangled Representations for Fair Graph Neural Networks

Yeon-Chang Lee, Hojung Shin, Sang-Wook Kim

AAAI 2025paperarXiv:2408.12875

#21440

MMed-RAG: Versatile Multimodal RAG System for Medical Vision Language Models

Peng Xia, Kangyu Zhu, Haoran Li et al.

ICLR 2025posterarXiv:2410.13085

#21441

Hotspot-Driven Peptide Design via Multi-Fragment Autoregressive Extension

Jiahan Li, Tong Chen, Shitong Luo et al.

ICLR 2025posterarXiv:2411.18463

#21442

Semantic Temporal Abstraction via Vision-Language Model Guidance for Efficient Reinforcement Learning

Tian-Shuo Liu, Xu-Hui Liu, Ruifeng Chen et al.

ICLR 2025oral

#21443

Enhancing Pre-trained Representation Classifiability can Boost its Interpretability

ICLR 2025arXiv:2510.24105

#21444

Reassessing How to Compare and Improve the Calibration of Machine Learning Models

Muthu Chidambaram, Rong Ge

ICLR 2025posterarXiv:2406.04068

#21445

Bridging the Gap Between f-divergences and Bayes Hilbert Spaces

Linus Lach, Alexander Fottner, Yarema Okhrin

ICLR 2025poster

#21446

DeepTAGE: Deep Temporal-Aligned Gradient Enhancement for Optimizing Spiking Neural Networks

Wei Liu, Li Yang, Mingxuan Zhao et al.

ICLR 2025oral

#21447

SysCaps: Language Interfaces for Simulation Surrogates of Complex Systems

Patrick Emami, Zhaonan Li, Saumya Sinha et al.

ICLR 2025posterarXiv:2405.19653

#21448

Revisit the Open Nature of Open Vocabulary Semantic Segmentation

Qiming Huang, Han Hu, Jianbo Jiao

ICLR 2025poster

#21449

Multi-Scale Fusion for Object Representation

Rongzhen Zhao, Vivienne Huiling Wang, Juho Kannala et al.

ICLR 2025posterarXiv:2410.01539

#21450

Recognize Any Surgical Object: Unleashing the Power of Weakly-Supervised Data

Jiajie Li, Brian Quaranto, Chenhui Xu et al.

ICLR 2025posterarXiv:2501.15326

#21451

SafeWatch: An Efficient Safety-Policy Following Video Guardrail Model with Transparent Explanations

Zhaorun Chen, Francesco Pinto, Minzhou Pan et al.

ICLR 2025posterarXiv:2412.06878

#21452

Improving Long-Text Alignment for Text-to-Image Diffusion Models

Luping Liu, Chao Du, Tianyu Pang et al.

ICLR 2025posterarXiv:2410.11817

#21453

On the Computation of the Fisher Information in Continual Learning

Gido van de Ven

ICLR 2025posterarXiv:2502.11756

#21454

3DMolFormer: A Dual-channel Framework for Structure-based Drug Discovery

Xiuyuan Hu, Guoqing Liu, Can Chen et al.

ICLR 2025posterarXiv:2502.05107

#21455

A Geometric Framework for Understanding Memorization in Generative Models

Brendan Ross, Hamidreza Kamkari, Tongzi Wu et al.

ICLR 2025posterarXiv:2411.00113

#21456

Glimpse: Enabling White-Box Methods to Use Proprietary Models for Zero-Shot LLM-Generated Text Detection

Guangsheng Bao, Yanbin Zhao, Juncai He et al.

ICLR 2025posterarXiv:2412.11506

#21457

Investigating Pattern Neurons in Urban Time Series Forecasting

Chengxin Wang, Yiran Zhao, shaofeng cai et al.

ICLR 2025poster

#21458

Can Watermarks be Used to Detect LLM IP Infringement For Free?

Zhengyue Zhao, Xiaogeng Liu, Somesh Jha et al.

ICLR 2025poster

#21459

Neural Approximate Mirror Maps for Constrained Diffusion Models

Berthy Feng, Ricardo Baptista, Katherine Bouman

ICLR 2025posterarXiv:2406.12816

#21460

GANDALF: Generative AttentioN based Data Augmentation and predictive modeLing Framework for personalized cancer treatment

Aishwarya Jayagopal, Yanrong Zhang, Robert Walsh et al.

ICLR 2025poster

#21461

On the Fourier analysis in the SO(3) space : the EquiLoPO Network

Dmitrii Zhemchuzhnikov, Sergei Grudinin

ICLR 2025poster

#21462

Grammar Reinforcement Learning: path and cycle counting in graphs with a Context-Free Grammar and Transformer approach

Jason Piquenot, Maxime Berar, Romain Raveaux et al.

ICLR 2025poster

#21463

HyperFace: Generating Synthetic Face Recognition Datasets by Exploring Face Embedding Hypersphere

Hatef Otroshi Shahreza, Sébastien Marcel

ICLR 2025posterarXiv:2411.08470

#21464

Rare-to-Frequent: Unlocking Compositional Generation Power of Diffusion Models on Rare Concepts with LLM Guidance

Dongmin Park, Sebin Kim, Taehong Moon et al.

ICLR 2025posterarXiv:2410.22376

#21465

Navigating the Digital World as Humans Do: Universal Visual Grounding for GUI Agents

Boyu Gou, Demi Ruohan Wang, Boyuan Zheng et al.

ICLR 2025posterarXiv:2410.05243

#21466

Decentralized Optimization with Coupled Constraints

Demyan Yarmoshik, Alexander Rogozin, Nikita Kiselev et al.

ICLR 2025posterarXiv:2407.02020

#21467

A Visual Dive into Conditional Flow Matching

Anne Gagneux, Ségolène Martin, Rémi Emonet et al.

ICLR 2025poster

#21468

A3D: Does Diffusion Dream about 3D Alignment?

Savva Ignatyev, Nina Konovalova, Daniil Selikhanovych et al.

ICLR 2025posterarXiv:2406.15020

#21469

Long Context Compression with Activation Beacon

Peitian Zhang, Zheng Liu, Shitao Xiao et al.

ICLR 2025posterarXiv:2401.03462

#21470

K-HALU: Multiple Answer Korean Hallucination Benchmark for Large Language Models

Jaehyung Seo, Heuiseok Lim

ICLR 2025poster

#21471

CipherPrune: Efficient and Scalable Private Transformer Inference

Yancheng Zhang, Jiaqi Xue, Mengxin Zheng et al.

ICLR 2025posterarXiv:2502.16782

#21472

Data Selection via Optimal Control for Language Models

Yuxian Gu, Li Dong, Hongning Wang et al.

ICLR 2025posterarXiv:2410.07064

#21473

VVC-Gym: A Fixed-Wing UAV Reinforcement Learning Environment for Multi-Goal Long-Horizon Problems

Xudong Gong, Feng Dawei, Kele Xu et al.

ICLR 2025oral

#21474

Scaling Laws for Downstream Task Performance in Machine Translation

Berivan Isik, NATALIA PONOMAREVA, Hussein Hazimeh et al.

ICLR 2025poster

#21475

CURIE: Evaluating LLMs on Multitask Scientific Long-Context Understanding and Reasoning

Hao Cui, Zahra Shamsi, Gowoon Cheon et al.

ICLR 2025posterarXiv:2503.13517

#21476

SVD-LLM: Truncation-aware Singular Value Decomposition for Large Language Model Compression

Xin Wang, Yu Zheng, Zhongwei Wan et al.

ICLR 2025posterarXiv:2403.07378

#21477

Federated Continual Learning Goes Online: Uncertainty-Aware Memory Management for Vision Tasks and Beyond

Giuseppe Serra, Florian Buettner

ICLR 2025posterarXiv:2405.18925

#21478

Diversity-Rewarded CFG Distillation

Geoffrey Cideron, Andrea Agostinelli, Johan Ferret et al.

ICLR 2025posterarXiv:2410.06084

#21479

NV-Embed: Improved Techniques for Training LLMs as Generalist Embedding Models

Chankyu Lee, Rajarshi Roy, Mengyao Xu et al.

ICLR 2025posterarXiv:2405.17428

#21480

GenXD: Generating Any 3D and 4D Scenes

Yuyang Zhao, Chung-Ching Lin, Kevin Lin et al.

ICLR 2025oralarXiv:2411.02319

#21481

Meta-Continual Learning of Neural Fields

Seungyoon Woo, Junhyeog Yun, Gunhee Kim

ICLR 2025posterarXiv:2504.05806

#21482

Semi-Supervised Vision-Centric 3D Occupancy World Model for Autonomous Driving

Xiang Li, Pengfei Li, Yupeng Zheng et al.

ICLR 2025oralarXiv:2502.07309

#21483

DPLM-2: A Multimodal Diffusion Protein Language Model

Xinyou Wang, Zaixiang Zheng, Fei YE et al.

ICLR 2025posterarXiv:2410.13782

#21484

DisCo: Graph-Based Disentangled Contrastive Learning for Cold-Start Cross-Domain Recommendation

Hourun Li, Yifan Wang, Zhiping Xiao et al.

AAAI 2025paperarXiv:2412.15005

#21485

Disentangled Contrastive Bundle Recommendation with Conditional Diffusion

Jiuqiang Li

AAAI 2025paper

#21486

Continuous Autoregressive Modeling with Stochastic Monotonic Alignment for Speech Synthesis

Weiwei Lin, Chenhang HE

ICLR 2025posterarXiv:2502.01084

#21487

Trained Transformer Classifiers Generalize and Exhibit Benign Overfitting In-Context

Spencer Frei, Gal Vardi

ICLR 2025posterarXiv:2410.01774

#21488

MM1.5: Methods, Analysis & Insights from Multimodal LLM Fine-tuning

Haotian Zhang, Mingfei Gao, Zhe Gan et al.

ICLR 2025posterarXiv:2409.20566

#21489

NarrativeBridge: Enhancing Video Captioning with Causal-Temporal Narrative

Asmar Nadeem, Faegheh Sardari, Robert Dawes et al.

ICLR 2025oralarXiv:2406.06499

#21490

Exploring Local Memorization in Diffusion Models via Bright Ending Attention

Chen Chen, Daochang Liu, Mubarak Shah et al.

ICLR 2025posterarXiv:2410.21665

#21491

Exploiting Structure in Offline Multi-Agent RL: The Benefits of Low Interaction Rank

Wenhao Zhan, Scott Fujimoto, Zheqing Zhu et al.

ICLR 2025posterarXiv:2410.01101

#21492

Towards Generalization Bounds of GCNs for Adversarially Robust Node Classification

Wen Wen, Han Li, Tieliang Gong et al.

ICLR 2025poster

#21493

TGB-Seq Benchmark: Challenging Temporal GNNs with Complex Sequential Dynamics

Lu Yi, Jie Peng, Yanping Zheng et al.

ICLR 2025oralarXiv:2502.02975

#21494

Process Reward Model with Q-value Rankings

Wendi Li, Yixuan Li

ICLR 2025posterarXiv:2410.11287

#21495

UniCon: Unidirectional Information Flow for Effective Control of Large-Scale Diffusion Models

Fanghua Yu, Jinjin Gu, Jinfan Hu et al.

ICLR 2025posterarXiv:2503.17221

#21496

Efficient Cross-Episode Meta-RL

Gresa Shala, André Biedenkapp, Pierre Krack et al.

ICLR 2025poster

#21497

Rethinking Neural Multi-Objective Combinatorial Optimization via Neat Weight Embedding

Jinbiao Chen, Zhiguang Cao, Jiahai Wang et al.

ICLR 2025poster

#21498

RB-Modulation: Training-Free Stylization using Reference-Based Modulation

Litu Rout, Yujia Chen, Nataniel Ruiz et al.

ICLR 2025poster

#21499

Single Teacher, Multiple Perspectives: Teacher Knowledge Augmentation for Enhanced Knowledge Distillation

Md Imtiaz Hossain, Sharmen Akhter, Choong Seon Hong et al.

ICLR 2025poster

#21500

Your Weak LLM is Secretly a Strong Teacher for Alignment

Leitian Tao, Yixuan Li

ICLR 2025posterarXiv:2409.08813

#21501

CONDA: Adaptive Concept Bottleneck for Foundation Models Under Distribution Shifts

Jihye Choi, Jayaram Raghuram, Yixuan Li et al.

ICLR 2025poster

#21502

Lean-STaR: Learning to Interleave Thinking and Proving

Haohan Lin, Zhiqing Sun, Sean Welleck et al.

ICLR 2025posterarXiv:2407.10040

#21503

Enhancing Zeroth-order Fine-tuning for Language Models with Low-rank Structures

Yiming Chen, Yuan Zhang, Liyuan Cao et al.

ICLR 2025posterarXiv:2410.07698

#21504

4K4DGen: Panoramic 4D Generation at 4K Resolution

Renjie Li, Panwang Pan, Bangbang Yang et al.

ICLR 2025oralarXiv:2406.13527

#21505

Unleashing the Power of Task-Specific Directions in Parameter Efficient Fine-tuning

Chongjie Si, Zhiyi Shi, Shifan Zhang et al.

ICLR 2025poster

#21506

Diffusing to the Top: Boost Graph Neural Networks with Minimal Hyperparameter Tuning

Lequan Lin, Dai Shi, Andi Han et al.

ICLR 2025posterarXiv:2410.05697

#21507

When Graph Neural Networks Meet Dynamic Mode Decomposition

Dai Shi, Lequan Lin, Andi Han et al.

ICLR 2025oralarXiv:2410.05593

#21508

DINOv2: Learning Robust Visual Features without Supervision

Pierre Fernandez, Piotr Bojanowski, Gabriel Synnaeve et al.

ICLR 2025poster

#21509

Uncertainty Herding: One Active Learning Method for All Label Budgets

Wonho Bae, Danica Sutherland, Gabriel Oliveira

ICLR 2025posterarXiv:2412.20644

#21510

$q$-exponential family for policy optimization

Lingwei Zhu, Haseeb Shah, Han Wang et al.

ICLR 2025posterarXiv:2408.07245

#21511

SEAL: Safety-enhanced Aligned LLM Fine-tuning via Bilevel Data Selection

Han Shen, Pin-Yu Chen, Payel Das et al.

ICLR 2025posterarXiv:2410.07471

#21512

Addressing Label Shift in Distributed Learning via Entropy Regularization

Zhiyuan Wu, Changkyu Choi, Xiangcheng Cao et al.

ICLR 2025posterarXiv:2502.02544

#21513

TIS-DPO: Token-level Importance Sampling for Direct Preference Optimization With Estimated Weights

Aiwei Liu, Haoping Bai, Zhiyun Lu et al.

ICLR 2025posterarXiv:2410.04350

#21514

Cross-Entropy Is All You Need To Invert the Data Generating Process

Patrik Reizinger, Alice Bizeul, Attila Juhos et al.

ICLR 2025posterarXiv:2410.21869

#21515

In Search of Forgotten Domain Generalization

Prasanna Mayilvahanan, Roland Zimmermann, Thaddäus Wiedemer et al.

ICLR 2025posterarXiv:2410.08258

#21516

Towards Hierarchical Rectified Flow

Yichi Zhang, Yici Yan, Alex Schwing et al.

ICLR 2025posterarXiv:2502.17436

#21517

Latent Safety-Constrained Policy Approach for Safe Offline Reinforcement Learning

Prajwal Koirala, Zhanhong Jiang, Soumik Sarkar et al.

ICLR 2025posterarXiv:2412.08794

#21518

Not All Prompts Are Made Equal: Prompt-based Pruning of Text-to-Image Diffusion Models

Alireza Ganjdanesh, Reza Shirkavand, Shangqian Gao et al.

ICLR 2025posterarXiv:2406.12042

#21519

HD-Painter: High-Resolution and Prompt-Faithful Text-Guided Image Inpainting with Diffusion Models

Hayk Manukyan, Andranik Sargsyan, Barsegh Atanyan et al.

ICLR 2025posterarXiv:2312.14091

#21520

Relax and Merge: A Simple Yet Effective Framework for Solving Fair $k$-Means and $k$-sparse Wasserstein Barycenter Problems

Shihong Song, Guanlin Mo, Hu Ding

ICLR 2025posterarXiv:2411.01115

#21521

To Tackle Adversarial Transferability: A Novel Ensemble Training Method with Fourier Transformation

Wanlin Zhang, Weichen Lin, Ruomin Huang et al.

ICLR 2025poster

#21522

Fewer May Be Better: Enhancing Offline Reinforcement Learning with Reduced Dataset

Yiqin Yang, Quanwei Wang, Chenghao Li et al.

ICLR 2025posterarXiv:2502.18955

#21523

VisualPredicator: Learning Abstract World Models with Neuro-Symbolic Predicates for Robot Planning

Yichao Liang, Nishanth Kumar, Hao Tang et al.

ICLR 2025posterarXiv:2410.23156

#21524

Reward Dimension Reduction for Scalable Multi-Objective Reinforcement Learning

Giseung Park, Youngchul Sung

ICLR 2025posterarXiv:2502.20957

#21525

SPD Attack - Prevention of AI Powered Image Editing by Image Immunization

Parth Badgujar, Shorya Singhal, Devansh Bhardwaj

ICLR 2025poster

#21526

Value-aligned Behavior Cloning for Offline Reinforcement Learning via Bi-level Optimization

Xingyu Jiang, Ning Gao, Xiuhui Zhang et al.

ICLR 2025poster

#21527

Hybrid Regularization Improves Diffusion-based Inverse Problem Solving

Hongkun Dou, Zeyu Li, Jinyang Du et al.

ICLR 2025poster

#21528

OpenMathInstruct-2: Accelerating AI for Math with Massive Open-Source Instruction Data

Shubham Toshniwal, Wei Du, Ivan Moshkov et al.

ICLR 2025posterarXiv:2410.01560

#21529

HGM³: Hierarchical Generative Masked Motion Modeling with Hard Token Mining

Minjae Jeong, Yechan Hwang, Jaejin Lee et al.

ICLR 2025poster

#21530

Logic-Logit: A Logic-Based Approach to Choice Modeling

Shuhan Zhang, Wendi Ren, Shuang Li

ICLR 2025poster

#21531

Learning Evolving Tools for Large Language Models

Guoxin Chen, Zhong Zhang, Xin Cong et al.

ICLR 2025posterarXiv:2410.06617

#21532

Enhancing Compositional Text-to-Image Generation with Reliable Random Seeds

Shuangqi Li, Hieu Le, Jingyi Xu et al.

ICLR 2025poster

#21533

Robust Representation Consistency Model via Contrastive Denoising

jiachen lei, Julius Berner, Jiongxiao Wang et al.

ICLR 2025oralarXiv:2501.13094

#21534

Frequency-Guided Masking for Enhanced Vision Self-Supervised Learning

Amin Karimi Monsefi, Mengxi Zhou, Nastaran Monsefi et al.

ICLR 2025posterarXiv:2409.10362

#21535

OpenPRM: Building Open-domain Process-based Reward Models with Preference Trees

Kaiyan Zhang, Jiayuan Zhang, Haoxin Li et al.

ICLR 2025poster

#21536

Self-play with Execution Feedback: Improving Instruction-following Capabilities of Large Language Models

Guanting Dong, Keming Lu, Chengpeng Li et al.

ICLR 2025posterarXiv:2406.13542

#21537

CertainlyUncertain: A Benchmark and Metric for Multimodal Epistemic and Aleatoric Awareness

Khyathi Chandu, Linjie Li, Anas Awadalla et al.

ICLR 2025poster

#21538

Hallo2: Long-Duration and High-Resolution Audio-Driven Portrait Image Animation

Jiahao Cui, Hui Li, Yao Yao et al.

ICLR 2025oralarXiv:2410.07718

#21539

GaussianBlock: Building Part-Aware Compositional and Editable 3D Scene by Primitives and Gaussians

Shuyi Jiang, Qihao Zhao, Hossein Rahmani et al.

ICLR 2025posterarXiv:2410.01535

#21540

Flat Reward in Policy Parameter Space Implies Robust Reinforcement Learning

HyunKyu Lee, Sung Whan Yoon

ICLR 2025poster

#21541

Integral Performance Approximation for Continuous-Time Reinforcement Learning Control

Brent Wallace, Jennie Si

ICLR 2025poster

#21542

A Theoretically-Principled Sparse, Connected, and Rigid Graph Representation of Molecules

Shih-Hsin Wang, Yuhao Huang, Justin Baker et al.

ICLR 2025poster

#21543

Efficient Perplexity Bound and Ratio Matching in Discrete Diffusion Language Models

Etrit Haxholli, Yeti Z. Gurbuz, Oğul Can et al.

ICLR 2025posterarXiv:2507.04341

#21544

Utility-Directed Conformal Prediction: A Decision-Aware Framework for Actionable Uncertainty Quantification

Santiago Cortes-Gomez, Carlos Patiño, Yewon Byun et al.

ICLR 2025posterarXiv:2410.01767

#21545

Uncovering Overfitting in Large Language Model Editing

Mengqi Zhang, Xiaotian Ye, Qiang Liu et al.

ICLR 2025posterarXiv:2410.07819

#21546

ParetoFlow: Guided Flows in Multi-Objective Optimization

Ye Yuan, Can Chen, Christopher Pal et al.

ICLR 2025posterarXiv:2412.03718

#21547

HyperDAS: Towards Automating Mechanistic Interpretability with Hypernetworks

Jiuding Sun, Jing Huang, Sidharth Baskaran et al.

ICLR 2025posterarXiv:2503.10894

#21548

Beyond Model Collapse: Scaling Up with Synthesized Data Requires Verification

Yunzhen Feng, Elvis Dohmatob, Pu Yang et al.

ICLR 2025posterarXiv:2406.07515

#21549

GReaTer: Gradients Over Reasoning Makes Smaller Language Models Strong Prompt Optimizers

Sarkar Snigdha Sarathi Das, Ryo Kamoi, Bo Pang et al.

ICLR 2025posterarXiv:2412.09722

#21550

Agent-to-Sim: Learning Interactive Behavior Models from Casual Longitudinal Videos

Gengshan Yang, Andrea Bajcsy, Shunsuke Saito et al.

ICLR 2025posterarXiv:2410.16259

#21551

MAPS: Advancing Multi-Modal Reasoning in Expert-Level Physical Science

Erle Zhu, Yadi Liu, Zhe Zhang et al.

ICLR 2025posterarXiv:2501.10768

#21552

Scaling Long Context Training Data by Long-Distance Referrals

Yonghao Zhuang, Lanxiang Hu, Longfei Yun et al.

ICLR 2025poster

#21553

AutoBencher: Towards Declarative Benchmark Construction

XIANG LI, Farzaan Kaiyom, Evan Liu et al.

ICLR 2025posterarXiv:2407.08351

#21554

Scaling Stick-Breaking Attention: An Efficient Implementation and In-depth Study

Shawn Tan, Songlin Yang, Aaron Courville et al.

ICLR 2025posterarXiv:2410.17980

#21555

Innovative Thinking, Infinite Humor: Humor Research of Large Language Models through Structured Thought Leaps

Han Wang, Yilin Zhao, Dian Li et al.

ICLR 2025posterarXiv:2410.10370

#21556

How Discrete and Continuous Diffusion Meet: Comprehensive Analysis of Discrete Diffusion Models via a Stochastic Integral Framework

Yinuo Ren, Haoxuan Chen, Grant Rotskoff et al.

ICLR 2025posterarXiv:2410.03601

#21557

ODE-based Smoothing Neural Network for Reinforcement Learning Tasks

Yinuo Wang, Wenxuan Wang, Xujie Song et al.

ICLR 2025poster

#21558

What is Wrong with Perplexity for Long-context Language Modeling?

Lizhe Fang, Yifei Wang, Zhaoyang Liu et al.

ICLR 2025posterarXiv:2410.23771

#21559

Is Factuality Enhancement a Free Lunch For LLMs? Better Factuality Can Lead to Worse Context-Faithfulness

Baolong Bi, Shenghua Liu, Yiwei Wang et al.

ICLR 2025posterarXiv:2404.00216

#21560

Residual Kernel Policy Network: Enhancing Stability and Robustness in RKHS-Based Reinforcement Learning

Yixian Zhang, Huaze Tang, Huijing Lin et al.

ICLR 2025poster

#21561

Doubly robust identification of treatment effects from multiple environments

Piersilvio De Bartolomeis, Julia Kostin, Javier Abad et al.

ICLR 2025posterarXiv:2503.14459

#21562

Can We Trust Embodied Agents? Exploring Backdoor Attacks against Embodied LLM-Based Decision-Making Systems

Ruochen Jiao, Shaoyuan Xie, Justin Yue et al.

ICLR 2025posterarXiv:2405.20774

#21563

Factor Graph-based Interpretable Neural Networks

Yicong Li, Kuanjiu Zhou, Shuo Yu et al.

ICLR 2025posterarXiv:2502.14572

#21564

ProteinBench: A Holistic Evaluation of Protein Foundation Models

Fei YE, Zaixiang Zheng, Dongyu Xue et al.

ICLR 2025posterarXiv:2409.06744

#21565

Enhancing Prediction Performance through Influence Measure

Shuguang Yu, Wenqian Xu, Xinyi Zhou et al.

ICLR 2025poster

#21566

Fine-Grained Verifiers: Preference Modeling as Next-token Prediction in Vision-Language Alignment

Chenhang Cui, An Zhang, Yiyang Zhou et al.

ICLR 2025posterarXiv:2410.14148

#21567

MMIE: Massive Multimodal Interleaved Comprehension Benchmark for Large Vision-Language Models

Peng Xia, Siwei Han, Shi Qiu et al.

ICLR 2025posterarXiv:2410.10139

#21568

Learning LLM-as-a-Judge for Preference Alignment

Ziyi Ye, Xiangsheng Li, Qiuchi Li et al.

ICLR 2025poster

#21569

Reliable and Diverse Evaluation of LLM Medical Knowledge Mastery

Yuxuan Zhou, Xien Liu, Chen Ning et al.

ICLR 2025posterarXiv:2409.14302

#21570

Step-Calibrated Diffusion for Biomedical Optical Image Restoration

Yiwei Lyu, Sung Jik Cha, Cheng Jiang et al.

AAAI 2025paperarXiv:2403.13680

#21571

Learning Graph Quantized Tokenizers

Limei Wang, Kaveh Hassani, Si Zhang et al.

ICLR 2025posterarXiv:2410.13798

#21572

PathGen-1.6M: 1.6 Million Pathology Image-text Pairs Generation through Multi-agent Collaboration

Yuxuan Sun, Yunlong Zhang, Yixuan Si et al.

ICLR 2025posterarXiv:2407.00203

#21573

From Decoupling to Adaptive Transformation: a Wider Optimization Space for PTQ

Zhaojing Wen, Qiulin Zhang, Yuan Zhang et al.

ICLR 2025poster

#21574

Scaling Large Language Model-based Multi-Agent Collaboration

Chen Qian, Zihao Xie, YiFei Wang et al.

ICLR 2025posterarXiv:2406.07155

#21575

Less is More: Masking Elements in Image Condition Features Avoids Content Leakages in Style Transfer Diffusion Models

Lin Zhu, Xinbing Wang, Chenghu Zhou et al.

ICLR 2025posterarXiv:2502.07466

#21576

When Prompt Engineering Meets Software Engineering: CNL-P as Natural and Robust "APIs'' for Human-AI Interaction

Zhenchang Xing, Yang Liu, Zhuo Cheng et al.

ICLR 2025poster

#21577

Quantifying Generalization Complexity for Large Language Models

Zhenting Qi, Hongyin Luo, Xuliang Huang et al.

ICLR 2025posterarXiv:2410.01769

#21578

Multi-Reward as Condition for Instruction-based Image Editing

Xin Gu, Ming Li, Libo Zhang et al.

ICLR 2025posterarXiv:2411.04713

#21579

A Tight Convergence Analysis of Inexact Stochastic Proximal Point Algorithm for Stochastic Composite Optimization Problems

Shulan Zhu, Chenglong Bao, Defeng Sun et al.

ICLR 2025poster

#21580

A Benchmark for Semantic Sensitive Information in LLMs Outputs

Qingjie Zhang, Han Qiu, Di Wang et al.

ICLR 2025poster

#21581

Lipschitz Bandits in Optimal Space

Xiaoyi Zhu, Zengfeng Huang

ICLR 2025poster

#21582

TEASER: Token Enhanced Spatial Modeling for Expressions Reconstruction

Yunfei Liu, Lei Zhu, Lijian Lin et al.

ICLR 2025posterarXiv:2502.10982

#21583

Provable Robust Overfitting Mitigation in Wasserstein Distributionally Robust Optimization

Shuang Liu, Yihan Wang, Yifan Zhu et al.

ICLR 2025posterarXiv:2503.04315

#21584

GROOT-2: Weakly Supervised Multimodal Instruction Following Agents

Shaofei Cai, Bowei Zhang, Zihao Wang et al.

ICLR 2025poster

#21585

Computing Circuits Optimization via Model-Based Circuit Genetic Evolution

Zhihai Wang, Jie Wang, Xilin Xia et al.

ICLR 2025poster

#21586

Vevo: Controllable Zero-Shot Voice Imitation with Self-Supervised Disentanglement

Xueyao Zhang, Xiaohui Zhang, Kainan Peng et al.

ICLR 2025posterarXiv:2502.07243

#21587

OmniBind: Large-scale Omni Multimodal Representation via Binding Spaces

zehan wang, Ziang Zhang, Minjie Hong et al.

ICLR 2025posterarXiv:2407.11895

#21588

RobustKV: Defending Large Language Models against Jailbreak Attacks via KV Eviction

Tanqiu Jiang, Zian Wang, Jiacheng Liang et al.

ICLR 2025posterarXiv:2410.19937

#21589

Sort-free Gaussian Splatting via Weighted Sum Rendering

Qiqi Hou, Randall Rauwendaal, Zifeng Li et al.

ICLR 2025posterarXiv:2410.18931

#21590

Is Your Model Really A Good Math Reasoner? Evaluating Mathematical Reasoning with Checklist

Zihao Zhou, Shudong Liu, Maizhen Ning et al.

ICLR 2025posterarXiv:2407.08733

#21591

Gyrogroup Batch Normalization

Ziheng Chen, Yue Song, Xiaojun Wu et al.

ICLR 2025poster

#21592

ZeroDiff: Solidified Visual-semantic Correlation in Zero-Shot Learning

Zihan Ye, Shreyank Gowda, Shiming Chen et al.

ICLR 2025posterarXiv:2406.02929

#21593

GrabS: Generative Embodied Agent for 3D Object Segmentation without Scene Supervision

Zihui Zhang, Yafei YANG, Hongtao Wen et al.

ICLR 2025posterarXiv:2504.11754

#21594

QP-SNN: Quantized and Pruned Spiking Neural Networks

Wenjie Wei, Malu Zhang, Zijian Zhou et al.

ICLR 2025oralarXiv:2502.05905

#21595

TidalDecode: Fast and Accurate LLM Decoding with Position Persistent Sparse Attention

Lijie Yang, Zhihao Zhang, Zhuofu Chen et al.

ICLR 2025posterarXiv:2410.05076

#21596

Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence

Weize Chen, Ziming You, Ran Li et al.

ICLR 2025posterarXiv:2407.07061

#21597

Adam-mini: Use Fewer Learning Rates To Gain More

Yushun Zhang, Congliang Chen, Ziniu Li et al.

ICLR 2025posterarXiv:2406.16793

#21598

Automatic Curriculum Expert Iteration for Reliable LLM Reasoning

Zirui Zhao, Hanze Dong, Amrita Saha et al.

ICLR 2025posterarXiv:2410.07627

#21599

ScienceAgentBench: Toward Rigorous Assessment of Language Agents for Data-Driven Scientific Discovery

Ziru Chen, Shijie Chen, Yuting Ning et al.

ICLR 2025posterarXiv:2410.05080

#21600

Relaxed Recursive Transformers: Effective Parameter Sharing with Layer-wise LoRA

Sangmin Bae, Adam Fisch, Hrayr Harutyunyan et al.

ICLR 2025posterarXiv:2410.20672

← Previous

1...106 107 108 109 110...112