Le Zhuo

7

Papers

188

Total Citations

Papers (7)

VideoEspresso: A Large-Scale Chain-of-Thought Dataset for Fine-Grained Video Reasoning via Core Frame Selection

Lumina-Image 2.0: A Unified and Efficient Image Generative Framework

From Reflection to Perfection: Scaling Inference-Time Optimization for Text-to-Image Diffusion Models via Reflection Tuning

PixWizard: Versatile Image-to-Image Visual Assistant with Open-Language Instructions

VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning

Lumina-T2X: Scalable Flow-based Large Diffusion Transformer for Flexible Resolution Generation

Video Background Music Generation: Dataset, Method and Evaluation