Le Zhuo

8

Papers

314

Total Citations

Papers (8)

T2I-R1: Reinforcing Image Generation with Collaborative Semantic-level and Token-level CoT

NeurIPS 2025arXiv

VideoEspresso: A Large-Scale Chain-of-Thought Dataset for Fine-Grained Video Reasoning via Core Frame Selection

Lumina-Image 2.0: A Unified and Efficient Image Generative Framework

LLaVA-MoD: Making LLaVA Tiny via MoE-Knowledge Distillation

From Reflection to Perfection: Scaling Inference-Time Optimization for Text-to-Image Diffusion Models via Reflection Tuning

PixWizard: Versatile Image-to-Image Visual Assistant with Open-Language Instructions

VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning

Lumina-T2X: Scalable Flow-based Large Diffusion Transformer for Flexible Resolution Generation