Dacheng Tao

40

Papers

398

Total Citations

Papers (40)

R1-VL: Learning to Reason with Multimodal Large Language Models via Step-wise Group Relative Policy Optimization

Divide, Conquer and Combine: A Training-Free Framework for High-Resolution Image Perception in Multimodal Large Language Models

Revisiting Plasticity in Visual Reinforcement Learning: Data, Modules and Training Stages

Revisiting Backdoor Attacks against Large Vision-Language Models from Domain Shift

SimDistill: Simulated Multi-Modal Distillation for BEV 3D Object Detection

One More Step: A Versatile Plug-and-Play Module for Rectifying Diffusion Schedule Flaws and Enhancing Low-Frequency Controls

Synergy of Sight and Semantics: Visual Intention Understanding with CLIP

MMReason: An Open-Ended Multi-Modal Multi-Step Reasoning Benchmark for MLLMs Toward AGI

Network Sparsity Unlocks the Scaling Potential of Deep Reinforcement Learning

Free-Form Motion Control: Controlling the 6D Poses of Camera and Objects in Video Generation

Mastering Massive Multi-Task Reinforcement Learning via Mixture-of-Expert Decision Transformer

Adaptive Defense against Harmful Fine-Tuning for Large Language Models via Bayesian Data Scheduler

ICLShield: Exploring and Mitigating In-Context Learning Backdoor Attacks

Learning system dynamics without forgetting

LLM Data Selection and Utilization via Dynamic Bi-level Optimization

AiDE-Q: Synthetic Labeled Datasets Can Enhance Learning Models for Quantum Property Estimation

Q-value Regularized Transformer for Offline Reinforcement Learning

Towards Theoretical Understandings of Self-Consuming Generative Models

Sparse Model Inversion: Efficient Inversion of Vision Transformers for Data-Free Applications

Merging Multi-Task Models via Weight-Ensembling Mixture of Experts

Generalization Analysis of Stochastic Weight Averaging with General Sampling

Task Groupings Regularization: Data-Free Meta-Learning with Heterogeneous Pre-trained Models

Representation Surgery for Multi-Task Model Merging

LoRA Recycle: Unlocking Tuning-Free Few-Shot Adaptability in Visual Foundation Models by Recycling Pre-Tuned LoRAs

Confronting Reward Overoptimization for Diffusion Models: A Perspective of Inductive and Primacy Biases

Neuron: Learning Context-Aware Evolving Representations for Zero-Shot Skeleton Action Recognition

Harnessing Text-to-Image Diffusion Models for Point Cloud Self-Supervised Learning

CopyrightShield: Enhancing Diffusion Model Security Against Copyright Infringement Attacks

Rethink Sparse Signals for Pose-guided Text-to-image Generation

Analytic Energy-Guided Policy Optimization for Offline Reinforcement Learning

Improving Complex Reasoning over Knowledge Graph with Logic-Aware Curriculum Tuning

Modeling All Response Surfaces in One for Conditional Search Spaces

TD²-Net: Toward Denoising and Debiasing for Video Scene Graph Generation

Multi-Step Denoising Scheduled Sampling: Towards Alleviating Exposure Bias for Diffusion Models

Sheared Backpropagation for Fine-tuning Foundation Models

UniMix: Towards Domain Adaptive and Generalizable LiDAR Semantic Segmentation in Adverse Weather

FREE: Faster and Better Data-Free Meta-Learning

Local-consistent Transformation Learning for Rotation-invariant Point Cloud Analysis

Learn from Downstream and Be Yourself in Multimodal Large Language Models Fine-Tuning

HarmoDT: Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning