Juan Carlos Niebles

10

Papers

436

Total Citations

2

Affiliations

Affiliations

SalesforceStanford University

Papers (10)

ULIP-2: Towards Scalable Multimodal Pre-training for 3D Understanding

Retroformer: Retrospective Large Language Agents with Policy Gradient Optimization

APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay

NeurIPS 2025arXiv

Re-thinking Temporal Search for Long-Form Video Understanding

LayoutDETR: Detection Transformer Is a Good Multimodal Layout Designer

X-InstructBLIP: A Framework for Aligning Image, 3D, Audio, Video to LLMs and its Emergent Cross-modal Reasoning

Exploring Diffusion Transformer Designs via Grafting

NeurIPS 2025arXiv

UniEgoMotion: A Unified Model for Egocentric Motion Reconstruction, Forecasting, and Generation

Taming generative video models for zero-shot optical flow extraction

ViUniT: Visual Unit Tests for More Robust Visual Programming