Shuicheng Yan

84

Papers

1,914

Total Citations

Papers (84)

Dual Path Networks

NeurIPS 2017arXiv

Highly Efficient Salient Object Detection with 100K Parameters

Matching-CNN Meets KNN: Quasi-Parametric Human Parsing

Dual-Agent GANs for Photorealistic and Identity Preserving Profile Face Synthesis

Tree-Structured Reinforcement Learning for Sequential Object Localization

NeurIPS 2016arXiv

Point Cloud Mamba: Point Cloud Learning via State Space Model

Predicting Scene Parsing and Motion Dynamics in the Future

NeurIPS 2017arXiv

Towards Semantic Equivalence of Tokenization in Multimodal LLM

Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis

MoH: Multi-Head Attention as Mixture-of-Head Attention

MoE++: Accelerating Mixture-of-Experts Methods with Zero-Computation Experts

Improving Video Segmentation via Dynamic Anchor Queries

Explore In-Context Segmentation via Latent Diffusion Models

JarvisArt: Liberating Human Artistic Creativity via an Intelligent Photo Retouching Agent

NeurIPS 2025arXiv

PointDGMamba: Domain Generalization of Point Cloud Classification via Generalized State Space Model

Perceptual Generative Adversarial Networks for Small Object Detection

Deep Joint Rain Detection and Removal From a Single Image

Memory-Augmented Attribute Manipulation Networks for Interactive Fashion Search

Object Region Mining With Adversarial Erasing: A Simple Classification to Semantic Segmentation Approach

Semantic Segmentation via Structured Patch Prediction, Context CRF and Guidance CRF

More Is Less: A More Complicated Network With Less Inference Complexity

Human Pose Estimation With Parsing Induced Learner

Towards Pose Invariant Face Recognition in the Wild

Multi-Oriented Scene Text Detection via Corner Localization and Region Segmentation

Neural Style Transfer via Meta Networks

AdversarialNAS: Adversarial Neural Architecture Search for GANs

PSGAN: Pose and Expression Robust Spatial-Aware GAN for Customizable Makeup Transfer

MetaFormer Is Actually What You Need for Vision

Deep Color Consistent Network for Low-Light Image Enhancement

Position-Guided Text Prompt for Vision-Language Pre-Training

Exploring Incompatible Knowledge Transfer in Few-Shot Image Generation

Towards Computational Baby Learning: A Weakly-Supervised Approach for Object Detection

Cross-Domain Image Retrieval With a Dual Attribute-Aware Ranking Network

Task-Driven Feature Pooling for Image Classification

Human Parsing With Contextualized Convolutional Neural Network

Additive Nearest Neighbor Feature Maps

Conditional Convolutional Neural Network for Modality-Aware Face Recognition

Personalized Age Progression With Aging Dictionary

Neural Person Search Machines

FoveaNet: Perspective-Aware Urban Scene Parsing

Recurrent 3D-2D Dual Learning for Large-Pose Facial Landmark Detection

Scale-Adaptive Convolutions for Scene Parsing

Video Scene Parsing With Predictive Feature Learning

Single-Stage Multi-Person Pose Machines

Very Long Natural Scenery Image Prediction by Outpainting

PnP-DETR: Towards Efficient Visual Analysis With Transformers

Tokens-to-Token ViT: Training Vision Transformers From Scratch on ImageNet

STPrivacy: Spatio-Temporal Privacy-Preserving Action Recognition

Masked Diffusion Transformer is a Strong Image Synthesizer

Rethinking Bottleneck Structure for Efficient Mobile Network Design

Self-Promoted Supervision for Few-Shot Transformer

Geometry-Guided Progressive NeRF for Generalizable and Efficient Neural Human Rendering

Improving Vision Transformers by Revisiting High-Frequency Components

DualFormer: Local-Global Stratified Transformer for Efficient Video Recognition

Video Graph Transformer for Video Question Answering

Drop an Octave: Reducing Spatial Redundancy in Convolutional Neural Networks With Octave Convolution

Combating Multimodal LLM Hallucination via Bottom-Up Holistic Reasoning

InceptionNeXt: When Inception Meets ConvNeXt

Structural Sparse Tracking

Shape Driven Kernel Adaptation in Convolutional Neural Network for Robust Facial Traits Recognition

Simultaneous Feature Learning and Hash Coding With Deep Neural Networks

Motion Part Regularization: Improving Action Recognition via Trajectory Selection

Deep Domain Adaptation for Describing People Based on Fine-Grained Clothing Attributes

SOLD: Sub-Optimal Low-rank Decomposition for Efficient Video Segmentation

Reversible Recursive Instance-Level Object Segmentation

Recurrently Target-Attending Tracking

Recurrent Face Aging

Semantic Object Parsing With Local-Global Long Short-Term Memory

Tensor Robust Principal Component Analysis: Exact Recovery of Corrupted Low-Rank Tensors via Convex Optimization

Interpretable Structure-Evolving LSTM

A^2-Nets: Double Attention Networks

Efficient Meta Learning via Minibatch Proximal Update

ConvBERT: Improving BERT with Span-based Dynamic Convolution

How Should Pre-Trained Language Models Be Fine-Tuned Towards Adversarial Robustness?

Direct Multi-view Multi-person 3D Pose Estimation

Towards Understanding Why Lookahead Generalizes Better Than SGD and Beyond

EnvPool: A Highly Parallel Reinforcement Learning Environment Execution Engine

Inception Transformer

NeurIPS 2022arXiv

Mutual Information Regularized Offline Reinforcement Learning

Gaussian Mixture Solvers for Diffusion Models

On Calibrating Diffusion Probabilistic Models

Efficient Diffusion Policies For Offline Reinforcement Learning

ScaleLong: Towards More Stable Training of Diffusion Model via Scaling Network Long Skip Connection

WSNet: Compact and Efficient Networks Through Weight Sampling