Xin Chen

Papers

365

Total Citations

Papers (51)

CycleINR: Cycle Implicit Neural Representation for Arbitrary-Scale Volumetric Super-Resolution of Medical Data

CVPR 2024

citations

Two-stream Beats One-stream: Asymmetric Siamese Network for Efficient Visual Tracking

AAAI 2025

citations

X-Dancer: Expressive Music to Human Dance Video Generation

ICCV 2025

citations

Learning Safety Constraints for Large Language Models

ICML 2025

citations

MikuDance: Animating Character Art with Mixed Motion Dynamics

ICCV 2025

citations

CohEx: A Generalized Framework for Cohort Explanation

AAAI 2025

citations

Learning Dynamic Collaborative Network for Semi-supervised 3D Vessel Segmentation

CVPR 2025

citations

DoDo-Code: an Efficient Levenshtein Distance Embedding-based Code for 4-ary IDS Channel

NeurIPS 2025

citations

Efficient Motion Prompt Learning for Robust Visual Tracking

ICML 2025

citations

End-to-End 3D Dense Captioning With Vote2Cap-DETR

CVPR 2023arXiv

citations

Devil Is in the Queries: Advancing Mask Transformers for Real-World Medical Image Segmentation and Out-of-Distribution Localization

CVPR 2023arXiv

citations

Text-Visual Prompting for Efficient 2D Temporal Video Grounding

CVPR 2023arXiv

citations

Progressive Differentiable Architecture Search: Bridging the Depth Gap Between Search and Evaluation

ICCV 2019

citations

Enhancing Low Light Videos by Exploring High Sensitivity Camera Noise

ICCV 2019

citations

Exploring Geometry-Aware Contrast and Clustering Harmonization for Self-Supervised 3D Object Detection

ICCV 2021

citations

Exploring Lightweight Hierarchical Vision Transformers for Efficient Visual Tracking

ICCV 2023arXiv

citations

A Large-Scale Outdoor Multi-Modal Dataset and Benchmark for Novel View Synthesis and Implicit Scene Reconstruction

ICCV 2023arXiv

citations

CancerUniT: Towards a Single Unified Model for Effective Detection, Segmentation, and Diagnosis of Eight Major Cancers Using a Large Collection of CT Scans

ICCV 2023

citations

Fan-Beam Binarization Difference Projection (FB-BDP): A Novel Local Object Descriptor for Fine-Grained Leaf Image Retrieval

ICCV 2023

citations

Circumventing Outliers of AutoAugment with Knowledge Distillation

ECCV 2020

citations

CATCH: Context-based Meta Reinforcement Learning for Transferrable Architecture Search

ECCV 2020

citations

Cornerformer: Purifying Instances for Corner-Based Detectors

ECCV 2022

citations

Contrastive Deep Supervision

ECCV 2022

citations

Visual Prompt Multi-Modal Tracking

CVPR 2023arXiv

citations

ESCNet:Edge-Semantic Collaborative Network for Camouflaged Object Detection

ICCV 2025

citations

ERL-MPP: Evolutionary Reinforcement Learning with Multi-head Puzzle Perception for Solving Large-scale Jigsaw Puzzles of Eroded Gaps

AAAI 2025

citations

PM-INR: Prior-Rich Multi-Modal Implicit Large-Scale Scene Neural Representation

AAAI 2024

citations

REGLO: Provable Neural Network Repair for Global Robustness Properties

AAAI 2024

citations

LL3DA: Visual Interactive Instruction Tuning for Omni-3D Understanding Reasoning and Planning

CVPR 2024

citations

Sparse Photometric 3D Face Reconstruction Guided by Morphable Models

CVPR 2018arXiv

citations

Robustness Verification of Classification Deep Neural Networks via Linear Programming

CVPR 2019

citations

TransNAS-Bench-101: Improving Transferability and Generalizability of Cross-Task Neural Architecture Search

CVPR 2021

citations

ChallenCap: Monocular 3D Capture of Challenging Human Performances Using Multi-Modal References

CVPR 2021arXiv

citations

Transformer Tracking

CVPR 2021arXiv

citations

Arch-Graph: Acyclic Architecture Relation Predictor for Task-Transferable Neural Architecture Search

CVPR 2022

citations

Wavelet Knowledge Distillation: Towards Efficient Image-to-Image Translation

CVPR 2022arXiv

citations

Executing Your Commands via Motion Diffusion in Latent Space

CVPR 2023arXiv

citations

SeqTrack: Sequence to Sequence Learning for Visual Object Tracking

CVPR 2023arXiv

citations

Online Optimal Control with Linear Dynamics and Predictions: Algorithms and Regret Analysis

NeurIPS 2019

citations

Biased Stochastic First-Order Methods for Conditional Stochastic Optimization and Applications in Meta Learning

NeurIPS 2020

citations

Graph Stochastic Neural Networks for Semi-supervised Learning

NeurIPS 2020

citations

On the Bias-Variance-Cost Tradeoff of Stochastic Optimization

NeurIPS 2021

citations

PDF: Point Diffusion Implicit Function for Large-scale Scene Neural Representation

NeurIPS 2023

citations

MotionGPT: Human Motion as a Foreign Language

NeurIPS 2023

citations

Michelangelo: Conditional 3D Shape Generation based on Shape-Image-Text Aligned Latent Representation

NeurIPS 2023

citations

Xin Chen

Papers (51)

Paint3D: Paint Anything 3D with Lighting-Less Texture Diffusion Models

Plug-In Diffusion Model for Sequential Recommendation

OMG: Towards Open-vocabulary Motion Generation via Mixture of Controllers

SUTrack: Towards Simple and Unified Single Object Tracking

Exploring Enhanced Contextual Information for Video-Level Object Tracking

MVPaint: Synchronized Multi-View Diffusion for Painting Anything 3D

CycleINR: Cycle Implicit Neural Representation for Arbitrary-Scale Volumetric Super-Resolution of Medical Data

Two-stream Beats One-stream: Asymmetric Siamese Network for Efficient Visual Tracking

X-Dancer: Expressive Music to Human Dance Video Generation

Learning Safety Constraints for Large Language Models

MikuDance: Animating Character Art with Mixed Motion Dynamics

CohEx: A Generalized Framework for Cohort Explanation

Learning Dynamic Collaborative Network for Semi-supervised 3D Vessel Segmentation

DoDo-Code: an Efficient Levenshtein Distance Embedding-based Code for 4-ary IDS Channel

Efficient Motion Prompt Learning for Robust Visual Tracking

End-to-End 3D Dense Captioning With Vote2Cap-DETR

Devil Is in the Queries: Advancing Mask Transformers for Real-World Medical Image Segmentation and Out-of-Distribution Localization

Text-Visual Prompting for Efficient 2D Temporal Video Grounding

Progressive Differentiable Architecture Search: Bridging the Depth Gap Between Search and Evaluation

Enhancing Low Light Videos by Exploring High Sensitivity Camera Noise

Exploring Geometry-Aware Contrast and Clustering Harmonization for Self-Supervised 3D Object Detection

Exploring Lightweight Hierarchical Vision Transformers for Efficient Visual Tracking

A Large-Scale Outdoor Multi-Modal Dataset and Benchmark for Novel View Synthesis and Implicit Scene Reconstruction

CancerUniT: Towards a Single Unified Model for Effective Detection, Segmentation, and Diagnosis of Eight Major Cancers Using a Large Collection of CT Scans

Fan-Beam Binarization Difference Projection (FB-BDP): A Novel Local Object Descriptor for Fine-Grained Leaf Image Retrieval

Circumventing Outliers of AutoAugment with Knowledge Distillation

CATCH: Context-based Meta Reinforcement Learning for Transferrable Architecture Search

Cornerformer: Purifying Instances for Corner-Based Detectors

Contrastive Deep Supervision

Visual Prompt Multi-Modal Tracking

ESCNet:Edge-Semantic Collaborative Network for Camouflaged Object Detection

ERL-MPP: Evolutionary Reinforcement Learning with Multi-head Puzzle Perception for Solving Large-scale Jigsaw Puzzles of Eroded Gaps

PM-INR: Prior-Rich Multi-Modal Implicit Large-Scale Scene Neural Representation

REGLO: Provable Neural Network Repair for Global Robustness Properties

LL3DA: Visual Interactive Instruction Tuning for Omni-3D Understanding Reasoning and Planning

Sparse Photometric 3D Face Reconstruction Guided by Morphable Models

Robustness Verification of Classification Deep Neural Networks via Linear Programming

TransNAS-Bench-101: Improving Transferability and Generalizability of Cross-Task Neural Architecture Search

ChallenCap: Monocular 3D Capture of Challenging Human Performances Using Multi-Modal References

Transformer Tracking

Arch-Graph: Acyclic Architecture Relation Predictor for Task-Transferable Neural Architecture Search

Wavelet Knowledge Distillation: Towards Efficient Image-to-Image Translation

Executing Your Commands via Motion Diffusion in Latent Space

SeqTrack: Sequence to Sequence Learning for Visual Object Tracking

Online Optimal Control with Linear Dynamics and Predictions: Algorithms and Regret Analysis

Biased Stochastic First-Order Methods for Conditional Stochastic Optimization and Applications in Meta Learning

Graph Stochastic Neural Networks for Semi-supervised Learning

On the Bias-Variance-Cost Tradeoff of Stochastic Optimization

PDF: Point Diffusion Implicit Function for Large-scale Scene Neural Representation

MotionGPT: Human Motion as a Foreign Language

Michelangelo: Conditional 3D Shape Generation based on Shape-Image-Text Aligned Latent Representation