Ziqiao Ma

5

Papers

148

Total Citations

Papers (5)

GROUNDHOG: Grounding Large Language Models to Holistic Segmentation

Do Vision-Language Models Represent Space and How? Evaluating Spatial Frame of Reference under Ambiguities

Inversion-Free Image Editing with Language-Guided Diffusion Models

SimWorld: An Open-ended Simulator for Agents in Physical and Social Worlds

VEGGIE: Instructional Editing and Reasoning Video Concepts with Grounded Generation