Chen Zhao

25

Papers

248

Total Citations

Papers (25)

MMVU: Measuring Expert-Level Multi-Discipline Video Understanding

End-to-End Temporal Action Detection with 1B Parameters Across 1000 Frames

Exploiting Multimodal Spatial-temporal Patterns for Video Object Tracking

STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution

HOISDF: Constraining 3D Hand-Object Pose Estimation with Global Signed Distance Fields

TexOct: Generating Textures of 3D Models with Octree-based Diffusion

Towards Automated Movie Trailer Generation

Splatter-360: Generalizable 360 Gaussian Splatting for Wide-baseline Panoramic Images

UltraHR-100K: Enhancing UHR Image Synthesis with A Large-Scale High-Quality Dataset

SMILE: Infusing Spatial and Motion Semantics in Masked Video Learning

Self-Ensembling Gaussian Splatting for Few-Shot Novel View Synthesis

Auto-Regressively Generating Multi-View Consistent Images

BoxDreamer: Dreaming Box Corners for Generalizable Object Pose Estimation

SolverLLM: Leveraging Test-Time Scaling for Optimization Problem via LLM-Guided Search

BOLT: Boost Large Vision-Language Model Without Training for Long-form Video Understanding

Dr2Net: Dynamic Reversible Dual-Residual Networks for Memory-Efficient Finetuning

From Zero to Detail: Deconstructing Ultra-High-Definition Image Restoration from Progressive Spectral Perspective

DVMNet: Computing Relative Pose for Unseen Objects Beyond Hypotheses

TexGaussian: Generating High-quality PBR Material via Octree-based 3D Gaussian Splatting

Ego-Exo4D: Understanding Skilled Human Activity from First- and Third-Person Perspectives

Do Models Explain Themselves? Counterfactual Simulatability of Natural Language Explanations

TexGarment: Consistent Garment UV Texture Generation via Efficient 3D Structure-Guided Diffusion Transformer

OSMamba: Omnidirectional Spectral Mamba with Dual-Domain Prior Generator for Exposure Correction

Metric-Agnostic Continual Learning for Sustainable Group Fairness

Wavelet-based Fourier Information Interaction with Frequency Diffusion Adjustment for Underwater Image Restoration