Xiangru Jian

3

Papers

6

Total Citations

Papers (3)

BigDocs: An Open Dataset for Training Multimodal Models on Document and Code Tasks

The Underappreciated Power of Vision Models for Graph Structural Understanding

AlignVLM: Bridging Vision and Language Latent Spaces for Multimodal Document Understanding

NeurIPS 2025arXiv