Tongkun Guan

3

Papers

20

Total Citations

Papers (3)

PosFormer: Recognizing Complex Handwritten Mathematical Expression with Position Forest Transformer

A Token-level Text Image Foundation Model for Document Understanding

Marten: Visual Question Answering with Mask Generation for Multi-modal Document Understanding