Hao Tang

26

Papers

207

Total Citations

Papers (26)

Delving into Multimodal Prompting for Fine-Grained Visual Classification

Stable-Hair: Real-World Hair Transfer via Diffusion Model

G2P-DDM: Generating Sign Pose Sequence from Gloss Sequence with Discrete Diffusion Model

HandDiff: 3D Hand Pose Estimation with Diffusion on Image-Point Cloud

Token Transformation Matters: Towards Faithful Post-hoc Explanation for Vision Transformer

MambaIC: State Space Models for High-Performance Learned Image Compression

Distilling ODE Solvers of Diffusion Models into Smaller Steps

DiffFNO: Diffusion Fourier Neural Operator

RobustMerge: Parameter-Efficient Model Merging for MLLMs with Direction Robustness

Towards Robust 3D Pose Transfer with Adversarial Learning

Learning with Unreliability: Fast Few-shot Voxel Radiance Fields with Relative Geometric Consistency

A Training-free Synthetic Data Selection Method for Semantic Segmentation

Boosting Adversarial Transferability with Spatial Adversarial Alignment

DynImg: Key Frames with Visual Prompts are Good Representation for Multi-Modal Video Understanding

SSR-Encoder: Encoding Selective Subject Representation for Subject-Driven Generation

ICON: Incremental CONfidence for Joint Pose and Radiance Field Optimization

Fast3R: Towards 3D Reconstruction of 1000+ Images in One Forward Pass

Versatile Navigation Under Partial Observability via Value-guided Diffusion Policy

HOIGPT: Learning Long-Sequence Hand-Object Interaction with Language Models

On the Faithfulness of Vision Transformer Explanations

PartRM: Modeling Part-Level Dynamics with Large Cross-State Reconstruction Model

ARNet: Self-Supervised FG-SBIR with Unified Sample Feature Alignment and Multi-Scale Token Recycling

MaskSAM: Auto-prompt SAM with Mask Classification for Volumetric Medical Image Segmentation

Multi-scale Activation, Refinement, and Aggregation: Exploring Diverse Cues for Fine-Grained Bird Recognition

Toward Adaptive Large Language Models Structured Pruning via Hybrid-grained Weight Importance Assessment

Similarity Memory Prior is All You Need for Medical Image Segmentation