Shitian Zhao

4

Papers

26

Total Citations

Papers (4)

PixWizard: Versatile Image-to-Image Visual Assistant with Open-Language Instructions

FontAnimate: High Quality Few-shot Font Generation via Animating Font Transfer Process

Causal-CoG: A Causal-Effect Look at Context Generation for Boosting Multi-modal Language Models

SPHINX-X: Scaling Data and Parameters for a Family of Multi-modal Large Language Models