Lei Wang

23

Papers

144

Total Citations

Papers (23)

S2WAT: Image Style Transfer via Hierarchical Vision Transformer Using Strips Window Attention

View-decoupled Transformer for Person Re-identification under Aerial-ground Camera Network

Unlocking Multimodal Mathematical Reasoning via Process Reward Model

NeurIPS 2025arXiv

Learnable Expansion of Graph Operators for Multi-Modal Feature Fusion

Attention-Driven GUI Grounding: Leveraging Pretrained Multimodal Large Language Models Without Fine-Tuning

Elegantly Written: Disentangling Writer and Character Styles for Enhancing Online Chinese Handwriting

Not All Parameters Matter: Masking Diffusion Models for Enhancing Generation Ability

Correlative and Discriminative Label Grouping for Multi-Label Visual Prompt Tuning

Graph Your Own Prompt

Puzzles: Unbounded Video-Depth Augmentation for Scalable End-to-End 3D Reconstruction

NeurIPS 2025arXiv

AUEditNet: Dual-Branch Facial Action Unit Intensity Manipulation with Implicit Disentanglement

Ditto: Quantization-aware Secure Inference of Transformers upon MPC

One-Way Ticket: Time-Independent Unified Encoder for Distilling Text-to-Image Diffusion Models

Taylor Videos for Action Recognition

Text-Driven Fashion Image Editing with Compositional Concept Learning and Counterfactual Abduction

Visual Representation Learning through Causal Intervention for Controllable Image Editing

Enhancing Few-Shot Class-Incremental Learning via Training-Free Bi-Level Modality Calibration

LoRA-FAIR: Federated LoRA Fine-Tuning with Aggregation and Initialization Refinement

Dynamic Multi-Layer Null Space Projection for Vision-Language Continual Learning

FedEL: Federated Elastic Learning for Heterogeneous Devices

T-SciQ: Teaching Multimodal Chain-of-Thought Reasoning via Large Language Model Signals for Science Question Answering

Roll with the Punches: Expansion and Shrinkage of Soft Label Selection for Semi-supervised Fine-Grained Learning

Exploiting Inter-sample and Inter-feature Relations in Dataset Distillation