Jieneng Chen

6

Papers

2

Total Citations

Papers (6)

Vision‑Language‑Vision Auto‑Encoder: Scalable Knowledge Distillation from Diffusion Models

NeurIPS 2025arXiv

Spatial457: A Diagnostic Benchmark for 6D Spatial Reasoning of Large Mutimodal Models

SpatialLLM: A Compound 3D-Informed Design towards Spatially-Intelligent Large Multimodal Models

3DSRBench: A Comprehensive 3D Spatial Reasoning Benchmark

Medical World Model

ViTamin: Designing Scalable Vision Models in the Vision-Language Era